RESURSELE LIMBII ROMÂNE ON-LINE dexonline a împlinit douăzeci de ani (2004-2024), III și Archeus

419

Cu îngăduința bunului cititor, înainte de a prezenta tema zilei, aș dori să mă refer la posibilitățile de căutare pe dexonline. Vom înțelege astfel avantajele de netăgăduit ale dicționarelor electronice în comparație cu cele tradiționale, pe hârtie.

Mai întâi, amploarea corpusului lexicografic. Așa cum am arătat în primul articol al acestei serii, DEX-ul este sursa centrală, fiind considerat cel mai important dicționar de uz curent al limbii române. Mă refer la numărul de intrări, la tratamentul normativ, la acuratețea definițiilor și la informațiile complementare de natură ortoepică, ortografică, morfologică și etimologică.

La intrările din DEX se adăugă cuvinte vechi, regionale, populare, provenind îndeosebi din Micul dicționar academic (MDA) ‒ și care este, să spunem, Dicționarul limbii române (DLR) actualizat și fără exemplificări ‒, dar și cuvinte noi, provenind din dicționarele de neologisme sau din cele specializate. O serie  de nume proprii sunt preluate din dicționare enciclopedice, onomastice etc. Așadar, din punctul de vedere al macrostructurii, dexonline este cel mai cuprinzător corpus lexicografic la care avem acces. El este, pe drept cuvânt, dicționarul dicționarelor românești contemporane (secolele XX-XXI), aliniind peste treizeci de lucrări de toate genurile.

Sunt convins că majoritatea beneficiarilor fac căutări simple. Am ales, la întâmplare, termenul „corabie”. Astfel, apar 24 de răspunsuri din diverse dicționare: explicative (10), ortografice (5), etimologice (1), enciclopedice (4), de argou, (1), de sinonime (3). În secțiunea dicționarelor explicative, apar și trimiterile (variantele) vechi din MDA:

corabe sf vz corabie

curabie sf vz corabie

dar și verbul:

corăbia2 vi [At: DICȚ., ap. I. GOLESCU, C. I, 78 / Pzi: ~iez / E: corabie] (Rar) A naviga.

La secțiunea dicționarelor enciclopedice, sunt recuperate un toponim și un astronim:

CORABIA, oraș în jud. Olt, port pe stg. Dunării; 22.745 loc. (1991). Expl. de argile. Fabrici de încălț., de tricotaje și conf., combinat de fibre și fire chimice; prelucr. lemnului; produse alim. Cea mai mare tăbăcărie minerală din România. Vestigii care atestă o permanentă locuire începând din milen. 3 î. Hr. Pe lîngă așezarea geto-dacică s-a dezvoltat o importantă cetate romano-bizantină cu numele de Sucidava, pe terit. fostului sat Celeiu. Importanța economică a crescut după pacea de la Adrianopol (1829). Declarat oraș în 1871.

CORABIA (Puppis), constelație din emisfera australă, situată lîngă constelația Cîinele Mare.

Mai mult, dexonline oferă posibilitatea de a face căutări avansate în interiorul definiților pentru recuperarea cuvintelor relaționate. Această opțiune permite nu doar „descoperirea” unui termen necunoscut sau uitat (de exemplu, numele unui anume tip de corabie), ci și crearea unui veritabil câmp analogic (format din cuvinte derivate sau alte tipuri de relații semantice: hiponimie, meronimie etc.):

ACROSTOL, acrostoluri, s. n. Parte înaltă a extremităților unei corăbii. ♦ (La pl.) Ornamente, sculpturi de la prora unei nave.

ANTENĂ, antene, s. f. 3. Bară lungă și mobilă prinsă transversal de catarg, spre a ține o parte din pânzele unei corăbii.

ARCĂ, arce, s. f. (Rar) Corabie. ◊ Arca lui Noe = corabia miticului Noe; fig. Îngrămădire eterogenă de oameni și de animale.

ARGONAUT, argonauți, s. m. 1. (Mitol.) Nume dat eroilor antici greci care au călătorit pe corabia Argo spre Colhida ca să aducă Lâna de aur.

BANDIERĂ, bandiere, s. f. 2. (Rar) Steag al unei corporații, al unei societăți, spec. al unei corăbii.

BRĂZDA, brăzdez, vb. I. 2. Tranz. și absol. (Despre roți, corăbii etc.) A lăsa urmă, dâră.

BRIGANTINĂ, brigantine, s. f. Navă cu pânze de dimensiuni mici, cu două catarge. ♦ Pânză de corabie de formă trapezoidală, fixată de catargul acestei nave.

CARAVELĂ, caravele, s. f. Corabie cu pânze, rapidă, folosită în trecut (de spanioli și de portughezi) pentru călătorii lungi.

CONTRASCOTĂ, contrascote, s. f. Fiecare dintre frânghiile prinse la colțurile pânzelor unei corăbii, servind la strângerea acestor pânze.

CORĂBIASCA s. f. art. Dans popular cu mișcare lentă, răspândit în Moldova; melodia după care se execută acest dans.

CORĂBIELE s. f. pl. (Rar) Corăbioare (2).

CORĂBIER, corăbieri, s. m. Navigator, marinar pe o corabie; proprietar al unei corăbii.

CORĂBIERIE s. f. (Înv.) 1. Industria construcției de corăbii. 2. Navigație.

CORĂBIOARĂ, corăbioare, s. f. 1. Diminutiv al lui corabie.

CORDAJ, cordaje, s. n. 1. Totalitatea frânghiilor, sforilor și parâmelor unei corăbii.

CORSAR, corsari, s. m. (În trecut) Corabie înarmată aflată în proprietatea particulară a unei persoane, care, cu învoirea guvernului, ataca și jefuia vasele inamice. ♦ Comandant al unei astfel de corăbii; p. ext. pirat, hoț de mare.

CORVETĂ, corvete, s. f. 1. Navă de război de mic tonaj, ușor armată și cu mare mobilitate în acțiune. 2. (Ieșit din uz) Corabie de război cu trei catarge, mai mică decât fregata și mai mare decât bricul.

DELESTA, delestez, vb. I. Tranz. A arunca lestul din corăbii, din baloane pentru a le ușura.

DEMARA, demarez, vb. I. 2. Tranz. A dezlega odgoanele unei corăbii (în vederea plecării).

DEMARAJ, demaraje, s. n. 2. Dezlegare a odgoanelor unei corăbii (în vederea plecării).

FELUCĂ, feluci, s. f. Corabie mică și îngustă, prevăzută cu pânze și cu lopeți, folosită în Marea Mediterană.

GALIOTĂ, galiote, s. f. Corabie ușoară, cu fundul plat și cu două catarge, folosită în trecut îndeosebi de olandezi.

GHIMIE, ghimii, s. f. (Înv.) Corabie (mică).

ÎNECA, înec, vb. I. 2. Refl. (Despre nave) A se scufunda. ◊ Expr. Parcă i s-au înecat corăbiile, se spune cuiva când e trist, indispus.

LINCĂI, pers. 3 lincăie, vb. IV. Intranz. (Rar; despre pânza unei corăbii) A se umfla de vânt.

NĂIER, năieri, s. m. (Rar) Luntraș; corăbier. [Pr.: nă-ier].

PESTELCĂ, pestelci, s. f. 2. Bucată de pânză dreptunghiulară prinsă cu o latură de verga unei corăbii, care servește la păstrarea la adăpost a burții velei, când aceasta este strânsă.

ROSTRAL, -Ă, rostrali, -e, adj. (Despre elemente de arhitectură sau despre obiecte de artă) Care are forma unei nave antice sau care este decorat cu sculpturi reprezentând prore de corăbii. ◊ Coloană rostrală = coloană ornată cu prore sculptate în relief în piatră, simbolizând victoriile navale.

ȘAMPANĂ, șampane, s. f. Corabie cu pânze, cu o capacitate de cinci până la zece vagoane, folosită în Extremul Orient.

TALPĂ, tălpi, s. f. Partea de dedesubt a corabiei.

TAVAN, tavane, s. n. (Reg.) Fiecare dintre cele două extremități ale unei corăbii, unde dorm corăbierii.

TENDĂ, tende, s. f. Apărătoare de soare sau de ploaie, în formă de acoperiș, făcută din pânză (la o luntre, la o corabie, pe o terasă etc.).

VÂNTREA, vântrele, s. f. Pânză de corabie; vetrelă.

VELĂ, vele, s. f. Pânză de corabie, care asigură deplasarea navei sub acțiunea vântului; p. ext. corabie, ambarcațiune cu pânze. ♦ (La pl.) Sport care se practică cu ajutorul ambarcațiunilor cu pânze.

VELIER, veliere, s. n. Corabie.

VERGĂ, vergi, s. f. Bară (de lemn sau de metal) așezată perpendicular pe catargul unei corăbii, folosită la susținerea unor vele.

VETRELĂ, vetrele, s. f. (Înv. și pop.) Pânză (de corabie); p. ext. corabie.

Cu evidențierea acestor două caracteristice specifice acestei baze de date ‒ amploarea corpusului și căutarea în text integral ‒, la care se adaugă accesul oricând, de oriunde, precum și viteza răspunsurilor, vom încheia considerațiile despre dexonline.

Trec acum la prezentarea unui alt site, Archeus (https://archeus.ro/lingvistica/main), o inițiativă privată lansată în 2006. Primul lucru pe care aș vrea să-l spun este faptul că Archeus s-a preocupat de la început de crearea unor resurse lingvistice pentru diferite aplicații: lematizator, corector gramatical, o soluție de adăugare automată a diacriticelor, traducător bilingv.

Lematizatorul este o aplicație fundamentală care permite reducerea formelor flexionate ale cuvintelor la forma de bază sau lemă (așa cum apare ca intrare în dicționar). Invers, scriind o lemă, detectăm toate formele flexionare sub care un cuvânt poate apărea în texte. Am să dau un exemplu:

„Ale turnurilor umbre peste unde stau culcate” (Gr. Alexandrescu, Umbra lui Mircea. La Cozia) va deveni: al + turn + umbră + peste + undă + (a) sta + (a) culca.

Această operație este extrem de complicată în limba noastră din cauza flexiunii adesea duble, a multor variante, a ambiguității morfo-semantice. De exemplu, lema roată, include formele: roată, roți, roata, roții, roțile, roților; roate, roatei, roatele, roatelor.

Un salt substanțial se observă la recentul Analizator gramatical. I-aș invita pe cititorii noștri, în special pe elevi, să folosească analiza morfologică disponibilizată. Putem folosi texte proprii pentru a vedea performanțele și, mai ales, a înțelege natura „erorilor”, care ne-ar putea conduce atât la o cunoaștere mai bună a limbii noastre, cât și la gândirea unor soluții de eliminare a respectivei ambiguități. Am să dau și aici un exemplu:

„Iată-l! Pieptul lat al locomotivei s-arată la cotitura liniei. Arătarea crește, crește mereu, sforăind semeață și alunecând cu eleganță maiestoasă către peron. Cazanul fierbe, fanfara țipă, școlarii intonează imnul, un concert monstru… Vagonul domnesc intră la peron. Un freamăt furnică de colo până colo prin mulțime.” (I.L. Caragiale, 25 de minute…).

Analiza verbelor, marcate de mine cu bold, este corectă. Mi-a plăcut decizia softului de a considera „furnică” verb, și nu substantiv. Chiar și la verb, această formă poate fi a indicativului prezent, perfect simplu sau a imperativului. La expresie, se indică corect „de colo până colo”. „Iată” este analizat ca interjecție, „mereu” este adverb, dar și adjectiv, după DEX, deci un termen ambiguu. Tot așa, „școlarii” este ambiguu, din cauza unei forme ipotetice a adjectivului antepus. Sunt sigur însă că unele soluții de IA pot ajuta ca în viitor aceste ambiguități să fie rezolvate. De regândit rostul menținerii arhaismelor, regionalismelor și unor forme paradigmatice improbabile, care „bruiază” analiza textelor contemporane.

Archeus are și el un DEX online, adică un pachet de dicționare aliniate în care regăsim DEX 1998, NODEX, Dicționarul de neologisme, DOOM, Dicționarul etimologic, Dicționarul de sinonime. La o căutare a cuvântului „corabie”, se dau automat termenii relaționați și o prezentare grafică a acestora (DEX vizual).

O particularitate salutară a acestui site este căutarea nu doar în dicționare, ci și într-un corpus disponibil (https://ro.wikisource.org/). Se obțin astfel atestări din scriitori clasici (Al. Macedonski, I.L. Caragiale, Dimitrie Anghel, Vasile Alecsandri ș.a.), compensând prin exemple din corpus absența citatelor. Este o soluție interesantă, care apropie acest DEX de la Archeus de unele dicționare străine (de pildă, Le Robert Dico en ligne).

Autor: Profesor, Dan Caragea (Lisabona-Portugalia)
Articol publicat în Occidentul Românesc, ediția lunară cu numărul 166, Anul XV.

Nota Redacției:
Dan Caragea este critic, eseist, publicist și traducător. Este lusitanist, specialist în psihologie și lingvistică computațională. Din 2011, colaborator voluntar în cadrul redacției Occidentul Românesc. Dan Caragea a absolvit Facultatea de Limba și Literatura Română (specialitate B: Limba și Literatura Portugheză). Este doctor în Psihologie. În perioada 1978-1990, a fost profesor de limba română și asistent la Facultatea de Limbi și Literaturi Străine (unde a predat limba portugheză), autor de manuale de limbă portugheză, traducător, publicând în reviste culturale din România. Între 1991 și 1993, a fost bursier al Institutul Camões din Lisabona, autor al unui manual de portugheză pentru străini, director al societății Cyberlex, responsabil pentru versiunile portugheză și spaniolă ale programului „Tropes” (analiza semantică a textului). Între 2009 și 2015 lucrează ca expert la UEFISCDI, unde realizează versiunea românească a programului „Tropes” și un software de detectare a similitudinilor (Semplag). Publică „Analiza automată a discursului”, în 2013, la Editura Academiei (coautor Adrian Curaj). În 2017 coordonează la Lisabona un mare album despre relațiile culturale și diplomatice româno-portugheze (la care este și coautor). În anii 2018-2019 este expert la Institutul de Lingvistică „Al. Rosetti – Iorgu Iordan” din București, colaborând la implementarea proiectului „Romtext” în România. Publică și în revista culturală Leviatan.