torstaina, toukokuuta 09, 2013

Puheentunnistus toimii jo veikeästi

Bloggasin tänään ensimmäistä kertaa blogiin puhumalla. En tarkoita audiobloggausta vaan puhumalla kirjoittamista. Puheentunnistuksella pystyy nykyisin tekemään jo kaikenlaista, varsinkin mobiililaitteilla.

Valmistelen parhaillaan rastipistettä Mobiilikesäkouluun. Olen lupautunut johdattamaan ihmisiä mTarinointiin. Mobiililaitteilla voi kerätä monin tavoin havaintoja kentältä. Havainnot voi yhdistää paikkatietoon ja kartalle. Niitä voi jakaa ja koostaa. Mobiilitarinoista voi tehdä juonellisia tai kollaaseja.

Huomasin aamulla, että tuoreella mobiililaitteellani voi kirjoittaa puhumalla (Asus Nexus 7, Android-laite). Olin perustanut mTarina-rastia varten Mobile Storytelling -blogin. Latasin Nexukseen Wordpressin sovelluksen ja kokeilin, josko bloggaaminen puhumalla onnistuisi. Ja sehän sujui kuin tanssi. En muokannut tekstiä yhtään käsin vaan julkaisin sen sellaisenaan. Ainut, mitä tein, oli kappalevaihtojen klikkaaminen.

Kirjoitusvirheitä tuli eniten siihen osaan tekstiä, jossa innostuin vähän nopeampaan puhetahtiin juttelemaan. Yllättävästi ohjelma korjasi puhekieltä kirjakieleksi, sanan 'miä' se kirjoitti 'minä' ja sanan 'omenapuitten' korjasi muotoon 'omenapuiden' (vaikka molemmat ovat oikein).

Tältä näyttää blogin kirjoittaminen puhumalla. Napautetaan oikeaa kenttää (otsikko, artikkeli, avainsana) ja sen jälkeen mikrofonipainiketta. Kun puheeseen tulee tauko, mikrofoni sulkeutuu automaattisesti. Teksti ilmestyy nopeasti näkyville puheen aikana.


Blogiviestini kommentissa Tarja Ollas kommentoi, miten Google-kääntäjäkin toimii nykyään sujuvasti. Hauskutusta syntyi puheentunnistuksen väärin kirjoittamasta kappaleesta. Itselleni tuli mieleen taideprojekti, jossa ensin puhun tajunnanvirtaa, en välitä virheistä. Sen jälkeen käännän useaan kertaan kääntäjäohjelmalla tekstin ja viimeiseksi käännän sen uudelleen alkukielelle.

Puheentunnistus kirvoitti Facebookissa suht vilkkaan keskustelun (sekä omassa profiilissani että Tablet-laitteet opetuksessa -ryhmässä).

Kommenttien kautta tuli esille, että hoitoalalla puheesta tekstiksi -teknologiaa on kehitetty Suomessa jo hyvällä menestyksellä, vaikka työ on vaativaa.

Keskusteluissa todettiin myös, että iOS-laitteilla toimiva Dragon Dictation on verraton. Se osaa jotain, mihin Androidin puheentunnistus ei vielä pysty, kuten erikoismerkkien kirjoittamisen, ison alkukirjaimen keskellä lausetta olevaan sanaan, rivinvaihdon ja uuden kappaleen aloittamisen. Merkit saa aikaan sanomalla: piste, pilkku, kaksoispiste, tavuviiva, ajatusviiva, huutomerkki, miukumauku jne. Joidenkin merkkien komennon keksiminen vaatii kokeilua. +-merkki syntyy sanomalla plusmerkki, ei plus tai plussa. Rivinvaihto syntyy sanomalla vaihda rivi ja uuden kappaleen sanomalla yksinkertaisesti uusi kappale. Löysin englanninkieliset vinkit Dragonin käyttämiseen ja virallisilta sivuiltakin löytyy ohjeita. Suomeksi piti vähän kokeilla, mikä komento toimii.

iOS-laitteilla ei voi kirjoittaa suoraan blogisovellukseen puhumalla, kuten Android-laitteella. Dragon Dictationista voi kuitenkin lähettää tekstin sähköpostina blogiin. Sähköpostiosoitteen saa Bloggeriin ylläpidossa Asetukset > Mobiili ja Wordpressiin ohjeen avulla. Eli hieman kiertotietä sama onnistuu. Kuvan lisääminen ei kuitenkään tällä keinolla käy. Posterous-blogiin sekin olisi onnistunut lisäämällä kuva liitetiedostoksi, mutta Posterous on mennyttä.

Tekstiviestin lähettäminen onnistuu myös Dragon Dictationilla. Sanellaan ensin viesti ja sitten napautetaan jakopainiketta. iOS 4-versiosta alkaen viesti siirtyy suoraan tekstiviestiksi. Tämä helpottaa sekä jänetuppitulehdusihmisten että kirjoitustaidottomien elämää ja voisi kuvitella muutaman lukihäiriöisenkin ilahtuvan.

Näin tekstiviesti lähtee iPhonella: ensin puhutaan viesti, sitten napautetaan jakopainiketta ja sms-kuvaketta (vanhemmissa puhelinmalleissa kopioi-toiminnolla leikepöydälle ja siitä tekstiviestikenttään):

1 kommentti:

Sun äitis kirjoitti...

Pekan (Ihanainen) kanssa viime viikolla juttelimme tästä kirjoituksesta, mutten sitten muistanutkaan kommentoida.

Minäkin olen tässä kevään mittaan harjoitellut puheesta tekstiksi -juttuja. Ajattelin, että jospa siitä olisi apua aineistojen litteroinnissa. Dragon Dictatea kokeilin jo pari vuotta sitten (silloin piti hankkia prepaidkortti ja perustaa tili jenkkistoreen, kun suomalaisessa App Storessa ei vielä ollut kaupan). Siksi ajattelin investoida just Dragonin tietokoneversioon, mutta kun olin siellä nettikaupassa, rupesi chat-asiakaspalvelija juttusille ja myikin saman firman MacScriben.

En ole vakuuttunut! Jotenkin tuli tunne, että lipsahdin ostamaan vanhentunutta tekniikkaa (MacScribe oli aikoinaan kovin hyvässä maineessa), joka ei vältsyyn toimi Mountai Lion -käyttiksessä (=kymmeniä kaatumisia). Lisäksi se ohjelma on kalibroimattomana ihan uuno! Kun sitä hiukka kouluttaa, ymmärtää se minun puhettani nyt aika ok, mutta haastattelunauhoihin siitä ei ole juurikaan apua.

Eilen sattui puhe tekstiksi -hommaan liittyen hauska juttu: pidin kollegan kanssa palaveria Skypellä ja minulla oli dokumentti samalla auki muokattavana. yhtäkkiä dokumenttiin alkoi tulla automaattikirjoitusta! Olin vahinjossa sohassut Muokkaa-valikosta Aloita sanelu ja siinä kollegan Skypepuheet silmien alla muuttuivat palaverimuistiinpanoiksi (Macissä on käyttöjätjestelmässä mukana tuo toiminto. Se vaan hirvittää, että sanat vilahtavat verkkoa pitkin amerikkalaispalvelimelle litteroitavaksi! Ja tällä huolella en viittaa tietoturvapelkoihin, vaan energiankulutukseen)! Vielä oli aika paljon oikolukua edellyttävä lopputulos, mutta nyt on puheentunnistus ottanut jo niin isoja harppauksia, että muutamassa vuodessa tästä varmasti tulee tosi iso juttu!

Tämän puheripulin päätteeksi varsinainen kommentti: kuulostaa mielenkiintoiselta tuo rasteilujuttunne!!