• Skip to Navigation
  • Skip to Content
Hem

Skriva på dator utan tangenter

Av Lars Hermansson ur F&F 6/2005.

Nya metoder att mata in text i handdatorer prövas. Ett sätt upptäcktes av en slump av matematiker i Lund.

Antalet avancerade mobiltelefoner och handdatorer ökar, och då växer också behovet av att mata in text direkt i dessa terminaler. Men apparaterna är så små att ett komplett tangentbord som går att använda med händerna inte får plats.

För mobiltelefoner dominerar inmatning med siffertangenter. Men på handdatorer har man ofta inga siffertangenter, och inmatningen sker då med hjälp av en penna som man ritar med på skärmen. Antingen visar datorn ett tangentbord på skärmen som man kan skriva på genom att peka med pennan på bokstäverna, eller så försöker datorn tolka handstilen.

Läsa handstilen gammalt

System för tolkning av handskriven text har funnits lika länge som datorerna. För att få in handstilen i datorn skriver man den på papper och skannar den sedan för att få den tolkad och digitalt lagrad i datorn. Tekniken, ofta kallad OCR, optical character recognition, är relativt välutvecklad även om kvaliteten på resultaten varierar. I dag används den till exempel för automatisk postsortering. Här får man stor hjälp av att maskinen kan gissa när tecknen är svåra att tolka. Antalet alternativ är starkt begränsade, eftersom det ju finns ett begränsat antal postorter i Sverige.

Det största problemet i tolkningen är att avgöra var ett tecken slutar och nästa börjar, och tekniken fungerar bäst för siffror. Störst framgång har tekniken rönt när det gäller avläsning av förtryckta blanketter. Dessa har oftast fält med en ruta för varje bokstav, men skriften som krävs känns onaturlig, och blanketterna upplevs som svåra att använda.

Tolka när du skriver

I en handdator går man inte omvägen via papper. Detta ger en fördel jämfört med att tolka handstil som är skriven på papper, eftersom datorn kan se hur pennan rör sig och därmed får ytterligare information.

Det finns i princip tre metoder för att tolka handstil. I den enklaste varianten skriver man varje bokstav för sig, men bokstaven måste skrivas utan att pennan lyfts. Tekniken kallas graffiti. Bokstäverna är inte heller identiska med riktig handstil, utan metoden kräver att man lär sig ett litet annorlunda alfabet. Systemet skiljer inte på versaler och gemener (stora och små bokstäver). Trots begränsningarna är denna teknik den vanligaste för handdatorer, och den används till exempel i operativsystemet PalmOS.

SCR, single character recognition, är en litet mer avancerad teknik, där man kan använda mer än ett penndrag för varje bokstav. Bokstäverna kan därmed se ut som vanliga bokstäver. Eftersom ett tecken görs i taget måste användaren dock texta.

Den mest avancerade tekniken kallas MCR, multiple character recognition, och är den som tillåter den naturligaste handstilen. Detta är den teknik som troligen kommer att ge bäst resultat i framtiden, men ännu finns inget system som fungerar tillräckligt bra.

Strunta i rätt detalj

Att tolka handstil kan vara nog så besvärligt för en människa. Jämfört med en dator är ändå vår hjärna bra på att urskilja väsentligheter från nonsens och skaffa sig en översiktlig uppfattning. En dator måste i detalj instrueras om hur denna urskillning ska gå till. Risken är att tolkningsprogrammet tar fasta på en överflödig detalj men missar ett litet betydelseskiljande streck.

Genom att filtrera tecken, ta fasta på de unika mönstren hos varje enskilt tecken och lära programmet att känna igen dessa och ignorera övrig information, kan man börja närma sig mänskliga prestanda i teckenigenkänningen, åtminstone i teorin. När man systematiserar tecknen på detta sätt kan man göra den slutliga abstraktionen med hjälp av matematiska verktyg som kallas invarianter.

En invariant är en storhet som inte ändras trots att objektet förändras. Om en triangel förminskas eller förstoras kommer storleksrelationerna mellan de olika sidorna i den att vara oförändrade, och dessa förhållanden är alltså invarianter. Skalförändringar är en form av transformation som används vid handstilsigenkänning, men det finns även andra, mer avancerade.

Genom att tilldela varje tecken en unik uppsättning geometriska invarianter, kan man angripa handstilsigenkänning genom att försöka identifiera dessa invarianter hos ett okänt tecken, jämföra de geometriska mönstren med de kända invarianterna och välja det tecken som stämmer bäst. Genom att använda sig av invarianter är det meningen att så länge texten är läslig för en annan människa, ska även datorprogrammet kunna känna igen den trots personliga variationer, darr och andra naturliga avvikelser.

Japansk text svårast

Handstilar har särdrag som till viss del kan hänföras till kön, ålder, utbildning och etnicitet. När man skapar sin tabell med jämförelsetecken, är det alltså viktigt att man samlar in ett gediget statistiskt material från skilda delar av befolkningen och inte bara från till exempel en vit ung manlig student i informatik.

En riktig utmaning för handskriftsigenkänning kommer dock när man lämnar det latinska alfabetet. Japansk handstil är sannolikt den som toppar listan. Japaner använder fyra olika uppsättningar tecken, ofta i samma text, och antalet möjliga tecken räknas därför i tusental.

Den kanske smartaste tekniken för att klara japanska kommer litet oväntat från svenska forskare. Av en slump upptäckte en doktorand vid Matematiska institutionen i Lund ett nytt sätt att tolka mänskliga handstilar som både fungerar bra för individuella handstilar och kan skilja på många och likartade tecken. Rikard Berthilssons avhandling handlade egentligen om datorseende och bildanalys. För några år sedan startade han företaget Decuma tillsammans med Gunnar Sparr och Karl Åström, båda professorer vid Matematiska institutionen, och nu används deras teknik i bland annat HP:s och Sonys handdatorer.

Författare: 
Lars Hermansson
Redaktör: 
Patrik Hadenius
  • Teknik & IT
  • alfabet
  • Berthilson
  • bildanalyser
  • datorer
  • datorprogram
  • datorseende
  • Decuma
  • elektronik
  • graffiti
  • handdatorer
  • handskriftsigenkänning
  • handstilar
  • handstilsigenkänning
  • hjärnan
  • HP
  • informatik
  • inmatningar
  • invarianter
  • Lunds universitet
  • matematik
  • MCR
  • mobiler
  • mobiltelefoner
  • Nutek
  • OCR
  • PalmOS
  • pennor
  • postsortering
  • SCR
  • siffertangenter
  • skärmar
  • Sony
  • Sparr
  • teknik
  • terminaler
  • textinmatning
  • tolkningsprogram
  • transformation
  • Verket för innovationssystem
  • Verket för näringslivsutveckling
  • Vetenskapsrådet
  • VINNOVA
  • VR
  • Åström

Kommentarer

Skrivet av barbro Wejdenstål 25. augusti 2005 - 12:45.

Mobiltelefonen har för få tangenter

Utvecklingen kommer alltid att gå framåt. Det är det som är livet och ger livslust. Nyheter och förändringar som man skall prova.

  • besvara

Skriv ny kommentar (OBS att det kan ta några timmar eller mer innan kommentaren hunnit godkännas för publicering!)

Innehållet i detta fält är privat och kommer inte att visas publikt.
CAPTCHA
För att förhindra maskingenererade skräpkommentarer (spam) ber vi dig att svara på nedanstående fråga.
Image CAPTCHA
Skriv tecknen i bilden här (ta hänsyn till versaler/gemener).

Meny

  • Start
  • Prenumerera
  • Webbshop
  • Blogg
  • Arkiv
  • Om F&F
  • Annonsera
  • Lediga jobb
  • Sajtkarta
  • Medicin
  • Fysik & astronomi
  • Humaniora & samhällsvetenskap
  • Biologi, kemi & geologi
  • Teknik & IT
  • Aktuellt nummer
  • Föregående nummer
  • Adresser till oss
  • Adressändra
  • Aktuellt nummer
  • Arkiv
  • Beställ
  • Bilden
  • Bokuppslaget
  • E-post till oss
  • F&F frågar dig
  • Fokus
  • Fråga F&F
  • Försäljningsställen
  • Gamla lösnummer
  • Hjärnbruk
  • Innehåll i aktuellt nummer
  • Innehåll i förra numret
  • Intressenter och bidragsgivare
  • Kontakt
  • Kundtjänst
  • Ledare
  • Listan
  • Lämna kommentarer om webbplatsen
  • Lästips
  • Lösnummer
  • Nobelpris
  • Nästa nummer
  • Om F&F
  • Omslag sedan 1990
  • Poddsändningar
  • Prenumerera på papperstidningen
  • Pressmeddelanden
  • Redaktionen
  • Rättelser
  • Samlarmappar
  • Senaste kommentarer
  • Shop
  • Sidan X
  • Skicka nyhetstips
  • Sök i papperstidningen
  • Sök på fof.se
  • Vidvinkel
  • Återkopplingar
  • Ändra adress

F&F rekommenderar

Den smutsiga belägringen av Sarajevo
Den smutsiga belägringen av Sarajevo

Sarajevo, de första dagarna i april 1992. Jugoslavien är i sönderfall. Slovenien och Kroatien har redan blivit självständiga efter krigen sommaren...

För 20 år sedan bröt krigen ut i det forna Jugoslavien. Ett av de mest uppmärksammade övergreppen var belägringen av Sarajevo. Oftast beskrevs den som ett krig mellan olika folk, men handlade också om kriminalitet, korruption och krigsbrott.

Användarinloggning

  • Användarnamn och lösenord finns på sidan 5 i papperstidningen.

Information

Faktaruta – Mobiltelefonen har för få tangenter

På mobiltelefoner matar man oftast in text med hjälp av siffertangenterna. Tangenten med siffran 2 står också för exempelvis a, b, c, å och ä. Vill man ha bokstaven c trycker man tre gånger på...

Direkt i din iPad eller iPhone

Annons

Lediga jobb

Professorer i pedagogiskt arbete
För anställning krävs avlagd doktorsexamen i ett för anställning relevant ämne och dokumenterad vetenskaplig och pedagogisk skicklighet samt god...
Universitetslektor i Pedagogik
Anställningen innebär planering, undervisning och examination på utbildningens grund- och avancerad nivå samt forskarnivå, i fristående kurser,...
Prefekt vid Institutionen för socialt arbete
Prefekten är chef och akademisk ledare för institutionen och har ett ansvar för verksamhetens utveckling och kvalitet, för resurser och resultat och...
Professorship in Glaciology
The main responsibility of the successful candidate will be to motivate, strengthen and develop GEUS’ research activities within the field of...
Ph.D. Fellowship
The position is within the Stem Cell Epigenetics Laboratory (SCEL), headed by Professor Philippe Collas. SCEL focuses on the regulation of gene...
  •  
  • 1 av 507
  • ››

Pressmeddelanden

Prenumerera på Forskning & Framstegs pressmeddelanden.

Forskning & Framsteg • Ansvarig utgivare och chefredaktör Patrik Hadenius. Webbredaktör: Jörn Spolander. • Adress: Box 1191, SE-111 91 Stockholm • Besöksadress Drottninggatan 108
Prenumerationer: 08-555 198 01 (vardagar 9.00–16.00, lunchstängt 12.00–13.00) • Kontaktuppgifter övriga redaktionen • Cookies • Utvecklad av NodeOne