Informatici z Google chcú presadiť nový koncept prekladania textov, ktorý sľubuje lepšie výsledky bez pomoci zo strany expertov.
Doteraz tento program vždy vychádzal z klasického slovníka. Vďaka rozšíreniu pravidiel gramatiky a rôznych výnimiek príslušného jazyka boli výsledky síce lepšie a lepšie, no zároveň stále ďaleko od skutočne dobrého prekladu. Predovšetkým niektoré citlivé rozdiely vo význame slov neustále spôsobovali problémy.
V Google sa práve pracuje na spôsobe, pri ktorom by sa dokonca aj slovníky vedeli kompletne automatizovať. No a k tomu je potrebné analyzovať štruktúru reči a vytvoriť vzájomné spojitosti. Základná myšlienka spočíva v tom, že v rôznych jazykoch sú v podstate zobrazené rovnaké veci. Čiže existujú slová, ktoré označujú konkrétne veci ako napríklad zvieratá – mačka, pes. V ďalšom kroku sú tieto vzájomne pospájané v podobných väzbách, ako napríklad vo vete: „ Mačka je zviera, ktoré je menšie ako pes.“
Takéto spojenia sa môžu objaviť aj pri mnohých iných výrazoch. Jazykovedci urobili v uplynulých rokoch výrazné pokroky. Snažili sa prepracovať podobnosť takýchto vzťahov do rôznych jazykov prostredníctvom vektorov.
Ukázalo sa, že sa vzájomne dáva do súvislosti množstvo rozdielnych nárečových slov s podobnými vektormi. Tak sa z jazykovedného problému pri prekladaní môže ľahko stať matematický problém, čo by bolo jednoznačne lepšie riešiť pomocou počítača.
Vývojári z Google už teraz zaznamenávajú veľmi dobré výsledky tejto metódy. Vďaka nej sa napríklad podarilo vyhľadať množstvo chýb v súčasnom algoritme prekladu medzi angličtinou a češtinou. Tiež je možné dosiahnuť lepšie výsledky v konfrontácii jazykov, ktoré nemajú relatívne podobné historické a kultúrne pozadie.
Zdroj: winfuture
Pridať nový komentár