Taligenkänning: Eftertankar om dess styrkor och svagheter

Jag måste erkänna att jag inte hade använt någon form av taligenkänning på länge när jag blev ombedd att göra handledningarna. Senast jag provade taligenkänning var det med Dragon Dictate , som var nytt när Windows 98 också var nytt. Mycket länge sedan i datorår!

Jag var glad över att ta itu med detta ämne eftersom jag var mycket intresserad av att se hur taligenkänningen har förbättrats. Och pojke, har det blivit bättre! Även en grundläggande, inbyggd applikation som denna gjorde ett otroligt bra jobb "direkt ur lådan." I den här sista artikeln om taligenkänning(Speech Recognition) skulle jag vilja prata om vad jag lärde mig när jag återbekantade mig med taligenkänningens underverk och vart jag ska ta vägen härifrån.

Inte redo för Star Trek än

Jag är säker på att många av oss såg besättningen på Starship Enterprise säga "Computer!"och får ett omedelbart svar. Vi har inga Starfleet -datorer än, men från och med Windows Vista och fortsätter i Windows 7 har vi datorer som lyssnar på oss och svarar på vad vi säger till dem – och svarar oss, om "Vad var det?" ("What was that?")anses vara ett svar.

Taligenkänning

Jag hade problem när jag först försökte använda taligenkänning(Speech Recognition) , och felsökningen var inte särskilt enkel. Hjälpfilerna är inte alltid tillräckligt användbara. Jag kunde hitta svaren på Microsofts(Microsoft) webbplats och i ett urval av onlineforum utan alltför mycket arbete. Det var så jag fick reda på att jag hade glömt att min webbkamera (sitter mitt framför mig ovanpå min bildskärm, och direkt i linje med hur jag pratade) också hade en aktiv mikrofon och ökade förvirringen. När jag väl fixade det gick det ganska smidigt sedan dess.

Jag försökte till och med prata med ett urval av olika accenter ( BBC brittiska(BBC British) och amerikanska(American) redneck, till exempel) och kunde få ganska bra igenkänning, vilket medgav skillnader i det amerikanska(American) standarduttalet . Naturligtvis säga "Friends, Romans, countrymen, lend me your ears!"samtidigt som jag gjorde mina allra bästa intryck av Helen Mirren och Jeff Foxworthy fick jag mig att skratta för mycket för att få helt korrekta resultat.

Språkigenkänning

Taligenkänning(Speech Recognition) kan användas med olika språk, och jag tänkte att jag skulle kunna testa det med min begränsade amerikansk(American) accent, spanska(Spanish) , tyska(German) och franska(French) , men tyvärr kan du inte använda andra språk om inte ditt operativsystem också är på det språket. Du kan ändra ditt operativsystems språk genom att installera ett annat språkpaket från Microsoft , men du kan bara göra det om du kör Windows 7 Ultimate eller Windows 7 Enterprise.

Taligenkänning

Taligenkänning(Speech Recognition) är tillgängligt för amerikansk engelska(US English) , brittisk engelska(UK English) , franska(French) , spanska(Spanish) , tyska(German) , japanska(Japanese) , traditionell kinesiska(Traditional Chinese) och förenklad kinesiska(Simplified Chinese) , och finns i dessa språks versioner av Windows 7 (alla versioner). Jag var ledsen att jag inte kunde prova det. Jag har ingen aning om vad som kommer att hända med Windows 8 , men jag tror att möjligheten att installera andra språkpaket skulle vara ett bra komplement till Windows 8 -motsvarigheterna till Windows 7 Professional och högre.

Vad som fungerar bra

Som jag nämnde är taligenkänning(Speech Recognition) designad för att fungera bäst med annan Microsoft -programvara. Så länge jag experimenterade med Microsoft- produkter var jag mycket framgångsrik (även om som man kunde förvänta sig var det både begränsat och komplicerat att använda Microsoft Office Excel ). Med annan programvara var det hit eller miss. Jag skulle kunna använda webbläsaren Google Chrome ganska bra (definitivt inte lika bra som Internet Explorer ) och mitt e- postprogram Eudora , som är ganska mycket antik programvara vid det här laget. (Eudora)Det är värt att experimentera med din egen favoritprogramvara för att se vad du kan göra. Kommandot "visa siffror" var särskilt användbart vid val av objekt och kommandon.

Jag upptäckte också att det inte tog särskilt lång tid innan noggrannheten i igenkänningen förbättrades markant. Jag gick igenom träningsövningarna två gånger, och efter det var igenkänningen nästan 100% korrekt. Jag kunde prata lite snabbare och satte in färre pauser för att mjukvaran skulle hänga med. Jag njöt verkligen av att se min röst översatt till ord på skärmen. Mina tidiga erfarenheter av taligenkänningsprogram var inte i närheten av så trevliga.

Taligenkänning

Det som inte fungerar bra

Som jag nämnde är viss programvara helt enkelt inkompatibel med taligenkänning(Speech Recognition) . Jag kunde inte ens öppna Adobe Reader eller Adobe AIR - versionen av TweetDeck . Jag upptäckte att jag inte kunde logga in på mitt Google- konto med Internet Explorer för att testa Google Dokument(Google Docs) — det verkade inte finnas något sätt att tala eller stava mitt lösenord. Jag misstänker att detta är ett säkerhetsproblem, att inte tillåta lösenord att sägas högt där någon annan kan höra, men det var irriterande.

Jag kunde öppna iTunes och välja en låt att spela, men kunde faktiskt inte få den att spela. Jag kunde öppna Scrivener (min valfri ordbehandlare) men "Visa siffror"("Show numbers") överlagrade inte siffror på något jag ville använda. Jag gjorde inga riktigt omfattande experiment med min favoritprogramvara – det är bara några som jag provade. Det skulle vara värt besväret för alla som vill använda taligenkänning(Speech Recognition) att testa de program de vill använda det med, för att vara säker på att det kommer att vara kompatibelt.

Fler länkar och resurser

Om du inte redan har sett de tidigare artiklarna kan du hitta dem här:

Konstigt nog är det nästan omöjligt att hitta någon information om taligenkänning(Speech Recognition)Microsoft Answers -webbplatsen utan att klicka på en länk från en Google- eller Bing -sökning. Jag kunde inte få några svar alls genom att lägga in "taligenkänning"("Speech Recognition") i sökrutan, även om det finns några frågor om det i forumen. Använd den här länken för att få hjälp med taligenkänning(Speech Recognition) från Windows-webbplatsen: Sökresultat för taligenkänning(Speech Recognition search results) .

Här är en kort Wikipedia - artikel som talar om historien om taligenkänning hos Microsoft : Windows Taligenkänning(Windows Speech Recognition) .

Här är ett blogginlägg som ger författarens tankar om att jämföra taligenkänning(Speech Recognition) med Dragon Naturally Speaking : Dragon NaturallySpeaking Versus Windows 7 Voice Recognition .

Slår ihop det

Jag gillade verkligen att arbeta med taligenkänning(Speech Recognition) och förundras över de förbättringar som har gjorts över tiden. Det skulle säkert vara tillräckligt bra för vardaglig användning, särskilt med Microsoft- produkter.

Kommer jag att fortsätta använda taligenkänning(Speech Recognition) ? Ja, när jag kan. Vid det här laget behöver jag inget mer sofistikerat. Det var väl värt tiden det tog att träna det och att träna mig själv att använda det rätt.



About the author

Jag är en mjukvarugranskare och trådlös ingenjör med över 10 års erfarenhet inom området. Jag är specialiserad på att granska mobila applikationer och mjukvara, samt att hjälpa kunder att optimera sina nätverk. Genom mina recensioner kan jag hjälpa dig att fatta välgrundade beslut om vilka produkter du ska använda, hur du kan förbättra ditt arbetsflöde med mera. Mina färdigheter inkluderar utmärkt skriftlig och muntlig kommunikation, problemlösning, stark teknisk kunskap och en känsla för detaljer. Jag är även skicklig på att arbeta självständigt och samarbeta i projekt.



Related posts