Pagrindinis Naujoves „Google AI“ dabar leidžia vartotojams akimirksniu versti tekstą 27 kalbomis naudojant telefono kameras

„Google AI“ dabar leidžia vartotojams akimirksniu versti tekstą 27 kalbomis naudojant telefono kameras

Kokį Filmą Pamatyti?
 
(GIF: „Google“)

(GIF: „Google“)



Dirbtinio intelekto dėka kelionė į užsienį dar nebuvo tokia paprasta.

„Google“ vertėjo programa leidžia vartotojams akimirksniu išversti tekstą. Programoje tiesiog nukreipkite fotoaparatą į tekstą, kurį norite išversti, ir pamatysite, kaip jis tiesiogiai į jūsų akis virs jūsų norima kalba - nereikia interneto ryšio ar mobiliojo telefono duomenų. Ši patogi funkcija buvo prieinama jau kurį laiką, tačiau ji buvo suderinama tik su septyniomis kalbomis. Dabar mašininio mokymosi dėka „Google“ atnaujino programą, kad akimirksniu išverstų 27 kalbas.

Taigi, kai kitą kartą būsite Prahoje ir negalėsite perskaityti meniu, mes jums pritarėme, rašė bendrovės „Google“ programinės įrangos inžinierius Otavio Goodas Tinklaraštis .

„Google“ taip pat naudojo dirbtinį intelektą, kad perpus sumažintų jų kalbos atpažinimo klaidas.

Be šios dienos, be vertimo iš anglų, prancūzų, vokiečių, italų, portugalų, rusų ir ispanų kalbų, realiuoju laiku taip pat galima išversti šias 20 kalbų: bulgarų, katalonų, kroatų, čekų, danų, olandų, filipiniečių, Suomių, vengrų, indoneziečių, lietuvių, norvegų, lenkų, rumunų, slovakų, švedų, turkų ir ukrainiečių kalbomis. Ir jei pasirinksite paveikslėlį, o ne žiūrėsite, kaip tekstas verčiamas tiesiogiai, iš viso palaikomos 37 kalbos.

Taigi, kaip „Google“ sugebėjo padidinti galimų kalbų skaičių? Pirmiausia jie įsigijo „Word Lens“, anksčiau buvusią papildytos realybės vertimo programą, ir naudojo mašininį mokymąsi bei konvoliucinius neuroninius tinklus, kad padidintų programos galimybes. Vaizdo atpažinimo pažanga buvo pagrindinė.

Prieš penkerius metus, jei davėte kompiuteriui katės ar šuns atvaizdą, jam buvo sunku pasakyti, kuris iš jų. Dėl konvoliucinių neuroninių tinklų kompiuteriai gali atskirti ne tik kates ir šunis, bet ir atpažinti skirtingas šunų veisles, sakė ponas Gudas. Taip, jie naudingi ne tik trippy art —Jei verčiate užsienio meniu arba pasirašote naudodamiesi naujausia „Google“ vertėjo programos versija, dabar naudojate gilų nervinį tinklą.

Žingsnis po žingsnio

Pirmas , Vertėjas turi pašalinti piktnaudžiavimą fone ir rasti tekstą. Suradęs tos pačios spalvos taškų taškelius, jis nustato, ar tai raidės. Ir kai tie dėmeliai yra arti vienas kito, jis supranta, kad tai tęstinė eilutė, kurią reikia skaityti.

Kitas, programa turi atpažinti, kokia yra kiekviena raidė. Čia atsiranda gilus mokymasis.

Mes naudojame konvoliucinį neuronų tinklą, mokydami jį naudoti raidėmis ir ne raidėmis, kad jis galėtų sužinoti, kaip atrodo skirtingos raidės, rašoma tinklaraščio įraše.

Tyrėjai turėjo mokyti programinę įrangą naudodami ne tik švarios išvaizdos, bet ir nešvarias raides. Laiškus realiame pasaulyje gadina apmąstymai, purvas, dėmės ir visokie keistenumai, rašė ponas Gudas. Taigi mes sukūrėme savo laiškų generatorių, kad sukurtume visokius netikrus nešvarumus, kurie įtikinamai imituotų realaus pasaulio triukšmą - netikri atspindžiai, netikri dėmeliai, netikri keistumai. Kai kurie iš

Kai kurios nešvarios raidės, naudojamos mokymams. (Nuotrauka: „Google“)








The trečias žingsnis ieško atpažintų raidžių žodyne, kad gautumėte vertimus. Jei norite dar tiksliau, žodynų paieškos yra apytikslės, jei S neteisingai skaitomas kaip 5.

Galiausiai, išverstas tekstas pateikiamas ant originalo tuo pačiu stiliumi.

Tai galime padaryti, nes jau radome ir perskaitėme paveikslėlyje esančias raides, todėl tiksliai žinome, kur jie yra. Galime pažvelgti į raides supančias spalvas ir naudoti jas originalioms raidėms ištrinti. Tada mes galime piešti vertimą ant viršaus, naudodami originalią priekinio plano spalvą, rašoma tinklaraščio įraše.

Siekdama būti kuo efektyvesnė ir leisti visus šiuos veiksmus atlikti realiuoju laiku be interneto ar duomenų ryšio, „Google“ komanda sukūrė labai mažą neuroninį tinklą, kurio viršutinė riba buvo informacijos, kurią ji gali apdoroti, tankis. Kadangi jie patys generavo mokymo duomenis, buvo svarbu įtraukti reikiamus duomenis, bet nieko papildomo, todėl neuroninis tinklas nenaudoja per daug savo informacijos tankio nesvarbiems dalykams. Pavyzdys galėtų būti tai, kaip ji turi atpažinti raidę su nedideliu pasukimu, bet ne per daug.

Galų gale vartotojams lieka dar 20 kalbų, tačiau tas pats greitas greitis.

TAIP PAT ŽR. „Google“ dirbtinio intelekto komanda suteikė mums žemų mašininio mokymosi tyrimų skaičių

Straipsniai, Kurie Jums Gali Patikti :