Duolingo

Am scris mai demult despre reCAPTCHA și modul în care proiectul contribuie la digitalizarea cărților. Cel care a fost cu ideea din spatele proiectul, a venit cu încă una, cel puțin la fel de interesantă: cum să înveți o limbă străină, ajuntând în același timp la traducerea Internetului?

Soluția e destul de simplă: duolingo. Oameni învață o limbă nouă traducând fraze din limba pe care vor să o învețe. Softul afișează fraza, și traducerea pentru fiecare cuvânt. Ei trebuie să traducă și să adapteze propoziția în limba nativă sau în engleză. Învâțând astfel cuvinte noi și expresii comune din limba pe care vor să o învețe.

Având în vedere că oamenii sunt mai motivați (vor să învețe), și accesul la soft este gratuit (comparativ cu softurile existente care sunt destul de scumpe), rezultatele traducerii sunt uneori mai bune decât cele făcute de traducători profesioniști. Cumva este explicabil fenomenul. Nu orice traducător are timp să “bibilească” o frază până să sune bine.

Site-ul nu e gata încă, însă vă puteți înscrie deja (o să primiți mail în ziua lansării). Mai jos aveți un video de prezentare și încă unul care explică mai bine modul de funcționare:

Continue reading “Duolingo”

Un lucru pe care nu-l știam despre reCAPTCHA

reCAPTCHA logo

 

Poate mulți dintre voi știau, însă eu am aflat de curând: sistemul reCAPTCHA ajută la digitalizarea cărților vechi.

Din cele două cuvinte pe care trebuie să le introduci, unul din ele provine din scanarea unei cărți vechi (un cuvânt care n-a fost recunoscut de programele OCR). Cu alte cuvinte, unul din ele este pentru controlul anti-spam (programul cunoaște cuvântul respectiv), iar celălalt este un cuvânt nerecunosctul automat de OCR și care va fi “tradus” cu ajutorul tău.

Momentan, conform informațiilor de pe Wikipedia, se lucrează la digitalizarea arhivei New York Times și a unor cărți din Google Books.

Alt lucru care nu-l știam, e că Google a cumpărat reCAPTCHA în 16 septembrie 2009.

Acum nu o să mai înjur când văd filtre anti-spam folosind reCAPTCHA, și o să mă chinui să traduc cât mai corect ambele cuvinte.