Într-o eră a digitalizării, până și studiul și documentarea se aliniază cerințelor moderne. Am tot discutat despre felul în care ar trebui să ne documentăm și să ne corectăm, am și scris despre păstrarea în viață a dicționarului în acest material (Ai să mori, bătrâne!), deoarece avem atâta nevoie de el, iar astăzi ne-am gândit să promovăm un alt canal de documentare și studiu, care pe noi ne fascinează prin prisma provocărilor și a volumului de muncă. Discutăm așadar în cele ce urmează cu promotorii proiectului Dexonline.ro, domnii Cătălin Frâncu și Radu Borza, cărora le aducem mulțumiri.
Totuși, înainte de a vă invita să citiți acest material, dorim să facem câteva mențiuni.
- Am fost rugați să păstrăm scrierea textelor, exact așa cum au fost acestea redactate și cităm aici această rugăminte: “scriem cu vechea ortografie (î din i și sînt); îi rugăm pe cei fascinați de reguli impuse politic să ne ierte!”.
- Ne-a făcut o deosebită plăcere să stăm de vorbă cu oamenii din spatele unui proiect atât de cunoscut, să le aflăm părerile și ideile și de aceea ne-am gândit să le împărtășim cu voi.
Suntem convinși de faptul că nu doar nouă ne face plăcere să citim despre oamenii implicați în păstrarea vie a limbii române, așa că vă invităm acum să parcurgeți acest material, care cel puțin pentru noi este deosebit de important.
Vă mulțumim pentru că ați acceptat invitația noastră de a participa la acest interviu! Pentru început, vă rog să ne spuneți în câteva cuvinte câte ceva despre proiectul dexonline.ro.
Cătălin Frâncu: De 18 ani, dexonline rezolvă problema cea mai stringentă a societății românești, și anume că în sfîrșit oamenii pot pune pariu pe sensul unui cuvînt și pot afla adevărul în timp real! Cum consultarea dicționarelor este o decizie reactivă (nu știu un cuvînt, deci îl caut), încercăm să facilităm exprimarea corectă și în mod activ, prin Cuvîntul Zilei, prin articole de exprimare sau, fiindcă oameni sîntem, amuzîndu-ne de gafele de prin politică, televiziuni și magazine. Dexonline este un proiect eminamente voluntar, deși avem și venituri care ocazional se adună de-un salariu decent (singura problemă e că se împarte la toată echipa).
Privit din exterior pare că dexonline este o platformă automatizată și pare destul de greu de crezut că în spatele ei sunt oameni care gestionează situații, care lucrează și creează fiecare idee ce se conturează în răspunsuri oferite. Cine este de fapt această echipă?
Radu Borza: Componența echipei o puteți găsi aici. În principiu, sîntem ingineri, mai toți pasionați de cuvinte sau jocuri de cuvinte (rebus, scrabble șamd)! De asemenea, ne mai ajută cu ilustrațiile cuvîntului zilei mai mulți desenatori.
Dar din „echipa dexonline” poate face parte oricine dorește să-și consume timp și creier în folosul comunității. Nu numai ca programator sau ca editori/corectori ai dicționarelor, ci orice fel de ajutor (de pildă ne lipsește cineva care să ne ajute la accesarea de fonduri).
Cătălin Frâncu: Apropo de automatizare, e o glumă tare cruntă pe xkcd. În esență, caricatura spune „În teorie, merită să mă strădui un pic să automatizez procesul X, pe care îl fac acum manual și îmi consumă așa de multe ore, pentru că pe termen lung cîștig timp. În practică, automatizarea nu merge niciodată bine, continui să fac efortul manual și acum mai am și un script (software) în plus de întreținut.” Unde vreau să ajung este că da, am automatizat părțile evidente – căutarea și introducerea de definiții –, dar unele activități continuăm să le facem manual, cum ar fi unele corecturi care nu pot fi făcute în masă. Deci migala nu ne este deloc străină și aș zice că este cea mai mare provocare la dexonline.
Aș mai adăuga că între 2002 și 2004 entuziasmul a fost foarte mare. A fost singura dată cînd echipa dexonline a numărat zeci de voluntari. Acea primă generație a introdus primele 65.000 de definiții, respectiv DEX ediția 1998, în mare parte tastîndu-le pur și simplu de la zero. Apoi am început să lucrăm mai eficient, prin digitizarea automată a definițiilor urmată de corectarea erorilor. Acest efort de corectură este unul mai specializat, astfel că în timp ne-am stabilizat la o echipă de numai doi editori.
Vă rog să îmi spuneți, statistic vorbind, care este numărul aproximativ de persoane care accesează această platformă?
Radu Borza: Anul trecut (2018), am fost accesați de 180 milioane de ori de ceva mai mult de 22 de milioane de utilizatori, iar ziua cînd s-a atins un maxim a fost 16 octombrie (peste 820.000 accesări, 270.000 de utilizatori).
Poate ar fi interesant de amintit că o treime dintre căutări provin din București sau că majoritatea căutărilor sînt realizate de sexul frumos (cu aproximativ 50% mai mult) !
Sunt fluctuații în ceea ce privește căutările? În perioade școlare, concedii, etc.
Radu Borza: Da, avem practic două șabloane periodice (nu sînt tocmai sinusoide) care se compun: una săptămînală (maximul e marțea, iar minimul sîmbăta) și una bianuală: maximele în mai și, mai ales, octombrie și minimele în ianuarie și august (cam la jumătate față de octombrie)!
Mai interesante ar fi fluctuațiile de căutare pentru un anume cuvînt, că putem detecta anumite evenimente doar uitîndu-ne pe statistici: de exemplu pe 13 martie a crescut brusc numărul de căutări pentru chiparos (de la o medie de 22/zi la peste 4000), pe 8 martie (previzibil) numărul de căutări pentru femeie, iar pe 12 februarie căutarea lui bubalină (de la 4/zi la peste 2300).
Având așadar acces la cuvintele tastate, ne puteți da exemple de cele mai căutate cuvinte pe dexonline.ro? Dar de cele mai amuzante?
Radu Borza: Anual facem topul celor mai căutate cuvinte (de exemplu cel pe 2018 sau cel din precedenții 10 ani). Așa putem să vă spunem cele mai căutate cuvinte, dar nu și cele mai amuzante, căci nu există o metodă automată de a măsura gradul de amuzament (bine, unora li s-ar părea amuzant faptul că „muie” a fost cuvîntul anului 2018, dar asta e altă discuție).
Cum spuneam și mai sus, sînt interesante „anomaliile” care apar în căutările de cuvinte (ăsta ar fi un proiect în sine dacă am avea voluntari sau fonduri)!
Cătălin Frâncu: Așa este, e fascinant că limba este o oglindă a societății și ne bucurăm că putem surprinde asta. Ne place să investigăm de unde provin aceste vîrfuri. Bunăoară, așa ne-am dat seama că unii elevi trișează la examenele de limba română, căci am observat vîrfuri pe cuvinte despre care ulterior am aflat că erau în subiectele de examen. Am decis că nu ne este indiferent cînd rodul muncii noastre este folosit în scopuri rele și așa s-a născut farsa de la simulările din 2017.
Ce și-a propus să facă dexonline.ro și ce reușește să facă? Și mai ales, care sunt planurile pentru viitor?
Cătălin Frâncu: Avem mult, mult mai multe idei decît reușim să implementăm (iată aici lista avînd în prezent 159 de idei, majoritatea punctuale, fără a le discuta pe cele mari). Direcțiile mari le-am enumerat în pagina noastră de donații; le reiau și expandez cu plăcere dacă doriți!
Radu Borza: dexonline a pornit cu ideea de a pune la dispoziția celor interesați un dicționar explicativ online complet al limbii române curente. Cu timpul, am realizat că noțiunea de complet este imposibil de atins (cel puțin atît timp cît vor exista vorbitori de limbă română)! Ca să facem treaba și mai complicată, nu ne-am mai limitat la un dicționar (avem cîteva zeci de dicționare), la cele explicative (avem și dicționare morfologice, de sinonime, etimologice șamd) și la limba curentă (am început să importăm și dicționare mai vechi).
Avem planuri foarte ambițioase (sîntem plini de idei), dar așteptăm să se dezvolte tehnologia clonării ca să avem timpul necesar pentru a le îndeplini!
Cum se alege cuvântul lunii și cuvântul zilei?
Radu Borza: Hehe, credeam că toată lumea știe cum se alege cuvîntul zilei! Avem un voluntar (Andreea Frâncu) care caută evenimente din anii trecuți pentru fiecare zi, iar pe baza acelui eveniment se alege un cuvînt! Cuvîntul este trimis (cu circa două-trei săptămîni înainte) desenatorilor, care îi asociază o imagine.
Cuvîntul lunii se alege mai puțin strict: dacă există un eveniment special în luna respectivă, alegem pe baza acelui eveniment (e mai complicat dacă sînt mai multe!), altfel alegem cel mai căutat cuvînt în luna precedentă!
Cătălin Frâncu: Avînd în vedere că Andreea îmi este cumnată, iar Radu naș, așteptăm cu interes acuzațiile de nepotism la dexonline! 🙂 Dar o observație mai sobră este că voluntarii sînt greu de găsit și prin familie am avut șanse mai mari să convingem oamenii să se implice. De exemplu, unul din fiii lui Radu a lucrat la etichetarea imaginilor pentru dicționarul vizual… și nici măcar el n-a lucrat pe gratis!
Putem vorbi de cenzură pe dexonline.ro? Sau există libertatea de a căuta orice?
Radu Borza: Nu există cenzură pe dexonline! Eventual, dacă scrii greșit un cuvînt, poți fi redirecționat automat către cuvîntul corect, dar altfel fiecare caută ce dorește și ne place să credem că fiecare găsește ceea ce caută!
Cătălin Frâncu: Ocazional lumea pune presiune pe noi să ne autocenzurăm, de regulă invocînd argumentul disponibilității pentru copii. Din păcate, lumea uită că cenzura este un rău în sine, iar noi, ca niște buni copii ai comunismului, o socotim mai rea decît multe alte rele. În mod sigur cenzura este mai rea decît afișarea unor definiții informative pentru niște concepte desemnate ca „doar pentru adulți” (adesea în mod arbitrar).
Din punctul nostru de vedere, această platformă este benefică, deoarece ne ajută să ne verificăm cunoștințele. E un feedback punctual, personal. Mai aveți și alte exemple de feedback venit din partea utilizatorilor?
Cătălin Frâncu: Sigur! Primim ocazional e-mailuri de mulțumire și asta ne bucură mult. Dar cel mai mult ne bucurăm cînd schimbăm cîteva vorbe cu cunoștințe ocazionale și ne întreabă ce facem. Cînd le răspundem că lucrăm la dexonline, invariabil primim laude și mulțumiri. Noi știm că facem un lucru util pentru că avem statistici de folosire a site-ului care măsoară asta. Dar un compliment verbal, față în față, are o nuanță mult mai personală și o putere mult mai mare.
Radu Borza: Am primit „feedback” chiar pe stradă sau în supermarket (cînd aveam un tricou cu dexonline pe mine)! Și este oarecum ciudat că cei mai mulți se miră cînd află că prestăm voluntar sau că nu avem o legătură cu Academia (probabil că nu se potrivește ceva cînd află despre ceva folositor că este și privat, și pe gratis)!
Vedem cu ușurință că limba română este deseori modificată după bunul plac. Cum se vede acest lucru din perspectiva administratorilor unui dicționar online?
Radu Borza: Noi nu sîntem cerberi ai limbii române, ci doar punem la dispoziția publicului dicționare importante! Rareori, dacă un termen încetățenit lipsește din dicționare, îl adaug (cu acribia unui lexicograf). Aici ne-am dori să creăm o aplicație automată de descoperire a cuvintelor folosite (cele scrise, evident), însă pînă acum ne-au lipsit fondurile!
Cătălin Frâncu: Subscriu. Merită menționat că există două curente principale de gîndire în lume. Unul merge către rigoare, către normarea limbii și pedepsirea publiciștilor care se abat de la norme (cazul Franței). Altul merge către consemnarea limbii, fără îngrădirea ei (cazul Statelor Unite). Mi se pare că România cumva se abate de la ambele direcții. Multe din dicționarele publicate sînt cu 10-20 de ani în urma limbii vorbite (și aici ar putea străluci dexonline, umplînd aceste goluri prin depistarea automată a cuvintelor folosite curent, dar neconsemnate). În schimb, ocazional schimbăm normele de dragul schimbării (vezi trecerea la scrierea cu â) sau adoptăm fără discernămînt neologisme inutile (trend, indoor, modelling, remake).
Am scris la un moment dat un articol despre dicționar, însă noi am făcut referire la el în forma fizică. Considerați că mai este util dicționarul în forma sa fizică, sau online-ul a acaparat totul?
Cătălin Frâncu: Spre deosebire de alte cărți, un dicționar nu este menit să fie citit din scoarță în scoarță, sau cel puțin nu în ordine. În general consultăm un dicționar punctual și doar cînd avem nevoie. De aceea, transpunerea pe Internet, sau mai general transpunerea într-un software de căutare, li se potrivește dicționarelor ca o mănușă. Am făcut ocazional experimentul de a căuta un cuvînt în ambele sisteme și, invariabil, căutarea în dicționarul tipărit este de 3-4-5 ori mai lentă decît tastarea cuvîntului în dexonline. Și diferența nu este doar una cantitativă, ci și calitativă. Un software poate permite tipuri de căutări care pur și simplu nu sînt posibile într-un dicționar tipărit:
- căutări în textul definițiilor (copil rege Spania);
- căutări după sufix (*uar);
- căutări după alte criterii și mai rafinate (zg?r*);
- căutări simultane în toate dicționarele;
- căutări ale unei declinări sau conjugări cînd nu cunoaștem forma de bază (semințelor)
- trimiteri la forma corectă a cuvîntului (patinuar)
Obiectiv vorbind așadar, cred că dezvoltarea calculatoarelor a adus completări fantastice „bătrînului” format tipărit.
Radu Borza: Nu cred că un dicționar explicativ tipărit poate concura în vreun fel cu cel electronic! De altfel, preferința mea se îndreaptă către forma scanată (dacă există), chiar atunci cînd doresc să caut în „original”. Nu exclud, totuși, ca anumite tipuri de dicționare să fie preferate în forma tipărită, dar asta doar pînă cineva va crea o structură eficientă pentru respectivele tipuri!
Adaug la lista lui Cătălin și descoperirea unor exemple de folosire a unor cuvinte în texte din literatură sau căutările combinate (neimplementate deocamdată din lipsă de fonduri):
- după partea de vorbire
- după etimologie
- după numărul de silabe
- după frecvență
Cartea – oau sau bau? Mai citesc oamenii? Ar mai trebui să o facă? De ce?
Cătălin Frâncu: Din ce am citit (sic!), românii citesc mai puțin decît alte nații europene, cam 5 minute pe zi. E puțin, e ridicol de puțin. Lectura, mai ales în copilărie și în adolescență, este vitală din multe motive interdependente: dezvoltă puterea de analiză, încetinește îmbătrînirea creierului, expandează vocabularul, crește puterea de concentrare, bineînțeles aduce informații noi în creier… Ca părinți, este important să ne obișnuim copiii cu prezența cărților, să-i lăsăm să ne vadă citind și să le citim și lor adesea, pentru a le stimula interesul și a propaga aceste beneficii și la generația următoare.
Și sînt studii (o recenzie: Scientific American, aprilie 2013) care arată că hîrtia e greu de bătut, că creierul nostru asimilează mai bine informații citite de pe hîrtie, din motive încă neînțelese complet. Orientarea spațială pare a fi un factor esențial, percepția cărții în toată grosimea ei și amintirea că ai citit un anumit pasaj pe la jumătatea cărții, în josul unei pagini din stînga.
Radu Borza: La o populație la mai puțin de jumătate din cea a României, Ungaria are o piață de carte de 3 ori mai mare (iar vecinii noștri sînt și ei în partea de jos a clasamentului), chestie care răspunde la întrebarea dacă se mai citește în România…
Ar mai trebui să o facă? În mod cert, da, în ciuda faptului că în ceea ce privește acumularea de informații sau cititul consider că cartea tipărită reprezintă trecutul! Dar nu cititul reprezintă problema în zilele noastre, ci înțelegerea textului citit. În 2018, rata analfabetismului funcțional (citești fără să înțelegi ce citești) era de circa 40% în rîndul elevilor de 15 ani…
Câtă muncă este în spatele proiectului Dexonline?
Cătălin Frâncu: Nu este ușor să dăm un răspuns exact! Am făcut la un moment dat niște estimări ținînd cont de diversele activități (introducere de definiții, corecturi, sinteze, apoi partea de programare, de răspuns la întrebări, alegerea cuvintelor zilei…). Pare că ne apropiem de 200.000 de ore investite ca echipă, iar eu personal am trecut de 20.000 de ore
Radu Borza: Marele avantaj al unei entități bazate pe voluntariat este că fiecare investește cît timp poate! Poate semăna cu prima parte a sloganului „fiecare după puteri, fiecăruia după nevoi” :), dar adevărul este că e cel mai plăcut mod de a lucra! În plus, fiecare poate aduce o îmbunătățire în sensul dorit de el!
Mai este nevoie să promovăm limba română? Mai este nevoie de campanii, de proiecte, de semnale de alarmă? Credeți că mai aduc vreun rezultat?
Cătălin Frâncu: Cred că este nevoie, deși nevoia de a vorbi corect este un sistem care se autoreglează. Oamenii tind să rîdă unii de alții cînd se surprind cu greșeli de limbă, cred că toți am făcut asta măcar o dată în viață. Iar această vînătoare creează o presiune socială de a vorbi corect. Eu consider că vorbirea corectă are, în primul rînd, un scop practic, nu unul patriotic (deși nici acela nu este de neglijat). Dacă vrei să te faci înțeles, dacă vrei ca oamenii să te asculte, trebuie în primul rînd să te exprimi corect.
Din acest punct de vedere, cred că Academia Română are mult de muncă pentru a le veni în întîmpinare celor care-și dau osteneala. Regulile limbii române sînt complicate inutil. Existența a două semne, â și î, pentru același sunet este cel mai bun exemplu. Alt exemplu este lipsa de unitate în tratarea unor prefixe și sufixe. De ce spunem trotuar, dar patinoar, iar apoi îi judecăm pe cei care nu învață pe dinafară două liste fără logică? Ar cădea cerul pe pămînt dacă am folosi, unitar, prefixul în- inclusiv înainte de -b- și -p-, deci înbujorat și înpreună? Și de unde vine obsesia cu cacofoniile, care ne face să contorsionăm frazele pînă devin neinteligibile, cînd atîtea alte limbi de mare circulație abia dacă studiază fenomenul la facultățile de litere?
Radu Borza: În mod cert. Mi-aș dori să ajungem la nivelul la care limba corectă să nu fie impusă, însă nu am ajuns la acest nivel (una dintre întrebările de mai sus arată unul din motive)! Dar nu trebuie să uităm că în 1900 analfabetismul în România era la o cotă de peste 80%, iar învățătorii se luptau cu crearea unei ortografii ușor de înțeles! Din păcate, procesul de simplificare a ortografiei monstruoase create de exagerările etimologiste nu numai că s-a oprit, dar pare că s-a inversat în 1993 (cu revenirea la ortografie cu â și sunt).
Lăsînd ortografia la o parte, mi se pare grav că există o tendință accelerată de reducere a vocabularului activ și pasiv și fără niște campanii în acest sens ne putem trezi că vocabularul ajunge pe căi naturale la situația descrisă în romanul 1984!
Care sunt beneficiile pe care le oferă dexonline.ro?
Radu Borza: Aș vrea să cred că beneficiile pe care le poate aduce dexonline nu sînt limitate de lucrurile la care ne-am gîndit noi! Din acest motiv, Cătălin a insistat în transparentizarea proiectului (este open source, iar datele, cu mici excepții independente de voința noastră, la fel). Din păcate, cei mai mulți consideră că punem la dispoziție codul și datele ca să ne poată clona site-ul, așa că avem un număr extrem de mic de contribuții (în general sînt prieteni de-ai noștri)!
Cătălin Frâncu: Ca exemplu la ce spune Radu, noi nu ne-am preocupat niciodată de aplicații pentru diverse echipamente (telefoane Android / iPhone, cititoare electronice etc.). Dar, fiindcă punem la dispoziție datele noastre în mod liber și gratuit, s-au găsit dezvoltatori independenți care au scris aceste aplicații. Dar din dar se face Rai!
Ce îndemn(uri) ați avea pentru cititorii acestui material?
Cătălin Frâncu: dexonline și-a asumat, oarecum dintr-un vid de implicare, această felie a Internetului: definițiile și exprimarea corectă. Dar mai interesantă decît munca în sine mi se pare lecția învățată de aici: e un mare vid de inițiativă și de implicare civică pe Internetul românesc și în societatea românească în general. Deci aș zice: dacă vreodată dexonline v-a fost util, gîndiți-vă că o mînă de oameni vi l-au pus la dispoziție în mod dezinteresat (avem și venituri, dar am fi murit de mult de foame dacă ne-am fi lăsat de serviciile noastre „pe bune”). Și gîndiți-vă dacă nu cumva v-ar plăcea și vouă să vă implicați într-un astfel de proiect. Sînt zeci și sute de ONG-uri și chiar proiecte lipsite de structură legală care strigă după voluntari. Alăturați-vă unuia dintre ele! Nici nu aveți idee cît bine puteți face în 10 ore, în 5 ore, în 2 ore pe săptămînă și ce satisfacție personală vă va aduce asta. Aceste mici gesturi de bunăvoință, de solidaritate între oameni, separă o societate plăcută de o junglă în care ne mîncăm unii pe alții.
Vă mulțumim pentru amabilitate și pentru timpul acordat și vă urăm succes în dezvoltarea proiectului dumneavoastră!
Ne revedem curând, cu alte materiale. Și nu uitați, dacă v-a plăcut acest articol, arătați-le și celorlalți!