RESURSELE LIMBII ROMÂNE ON-LINE: Solirom I, de Dan Caragea

799

După apariția dexonline, ani la rândul am așteptat ca institutele noastre de lingvistică, de sub oblăduirea Academiei, să pună la dispoziția publicului, în noua epocă informatizată, resurse lexicografice de stringentă necesitate, constant îmbogățite și actualizate. Vă imaginați cât am fi avut de câștigat dacă DEX-ul ar fi migrat în primul deceniu al acestui secol într-o bază de date a Academiei, cu acces liber, fiind permanent adus la zi, îmbunătățit, cu o prezentare grafică modernă și cu soluții inteligente de căutare!

Proiecte nu au lipsit, în special la Iași, dar și la București. Iașul anunța încă din 2004 dorința de a recupera digital DLR-ul, iar Bucureștiul a visat și el la informatizare până în 2020. În cele din urmă, Institutul de lingvistică „Alexandru Philippide” din Iași a izbutit să disponibilizeze un portal de „instrumente și resurse digitate pentru limba și literatura română” intitulat Solirom („Numele ales este o abreviere a numelui Societății literare române și reprezintă o formă de omagiere a întemeietorilor Academiei Române.”), publicând dicționare începând cu 2020.

Așa cum se spune pe pagina inițială, Solirom „Este o platformă software care cuprinde resurse lingvistice digitalizate sau digitizate și instrumente lingvistice digitale dedicate limbii și literaturii române.” Site-ul are mai multe secțiuni pe care le vom prezenta în cele ce urmează.

  1. CLRE. Corpus lexicografic românesc electronic este un proiect al Academiei Române (începând cu anul 2014) și reprezintă o colecție de ediții digitale ale celor mai reprezentative dicționare ale limbii române din toate timpurile, aliniate la nivel de intrare. Astfel, în CLRE sunt avute în vedere următoarele categorii de dicționare:

– dicționare generale – de tipul: DA = Academia Română, Dicționarul limbii române, tom I-II, coord. Sextil Pușcariu, întocmit și publicat după îndemnul și cu cheltuiala Maiestății Sale Regelui Carol I, București, 1913-1948; DLR = Academia Română, Dicționarul limbii române (DLR). Serie nouă, tom VI-XIV, București, 1965-2010; DEX = Dicționarul explicativ al limbii române. Ediția a II-a revăzută și adăugită. București, Editura Univers Enciclopedic Gold, 2009; MDA = Micul dicționar academic. Vol. I-IV. București, Editura Univers Enciclopedic. 2001-2003 ş.a.”

– dicționare etimologice: DELR = Academia Română, Dicționarul etimologic al limbii române (ediția electronică) 2022–, ediția digitală https://delr.lingv.ro/; Dicționarul ortografic, ortoepic și morfologic al limbii române. Ediția a III‑a, București, Univers Enciclopedic, 2023–, ediția digitală https://doom.lingv.ro/; Alexandru Ciorănescu, Dicționarul etimologic al limbii române. Ediție îngrijită și traducere din limba spaniolă de Tudora Șandru‑Mehedinți și Magdalena Popescu Marin. București, Editura Saeculum I. O., 2002 ș.a.

– dicționare speciale, enciclopedice, alese după criteriul importanței lor pentru perspectiva diacronică asupra limbii – de tipul: Dicționar enciclopedic, București, Editura Enciclopedică, 1993‑2009; Lexiconul tehnic român. I ș.u. Elaborare nouă. București, Editura Tehnică, 1957 ș.u.

Principalele obiective ale proiectului CLRE:

– realizarea celui mai mare corpus diacronic digital de dicționare ale limbii române, format din ediții digitale ale celor mai reprezentative lucrări lexicografice pentru limba română din bibliografia DLR;

– promovarea lucrărilor lexicografice realizate sub egida Academiei Române, Secția de Filologie și Literatură (și prin includerea CLRE pe SOLIROM, platforma cu resurse digitale a Academiei Române https://solirom.ro/);

– oferirea informației din CLRE cu acces liber pentru public.”

Să facem acum câteva observații: DEX, 2009, și MDA2, 2010, sunt integral disponibilizate pe platforma dexonline în versiuni digitale. Poate de aceea, Solirom a optat de fapt pentru versiunea digitalizată a DEX 1975. De asemenea, Dicționarul etimologic al limbii române, de Al. Ciorănescu, tradus de Tudora Șandru-Mehedinți și Magdalena Popescu Marin, este și el prezent pe dexonline în versiune digitală. Și Dicționarul enciclopedic român este deopotrivă prezent pe dexonline, tot în format digital. În astfel de situații, dublarea acestor munci nu este doar inutilă, ci dovedește că institutul și-a pierdut busola. Oare nu e normal ca cercetătorii să se dedice unor dicționare din secolul al XIX-lea, într-un efort de recuperare, dacă timpul le prisosește?

Ca să se ajungă la „cel mai mare corpus diacronic” este necesară o muncă asiduă și continuată și de un bun management care astăzi lipsește. Or, pe Solirom, din câte am constatat, munca pare să fi încetat de vreo doi ani, totul rămânând în stadiul atât de potrivit culturii noastre de… șantier.

CLRE cuprinde, la ora actuală, următoarele lucrări lexicografice:

(DA / DLR) Dicționarul limbii române

Este vorba de marele dicționar al limbii noastre, digitalizat după ediția anastatică din 2010. Căutările sunt limitate la cuvântul-titlu. Putem face și filtrări în tot dicționarul în funcție de categoria gramaticală. Disponibilizarea acestui dicționar este neîndoios cel mai de seamă merit al site-ului. Chiar dacă numărul de accesări nu a depășit 9000, efortul institutului ieșean este întrutotul lăudabil.

(DLR2) Dicționarul limbii române

Este prima fasciculă (A-Ab) din noua ediția a DLR, publicată în 2021. Meniul de căutare oferă o serie de posibilități de filtrare în funcție de: categoria gramaticală, domeniu, distribuția geografică, distribuția temporală, registru ș.a. În schimb, nu putem face căutări în definiții, citate etc. din cauza unei concepții informatice submediocre. Vom reveni, desigur, în detaliu.

(DL) Dicționarul limbii române literare contemporane

Este singurul nostru dicționar cu atestări (exceptând DLR) la care publicul are acces. A fost publicat în 1955-1957, în patru volume, în condiții grafice sporite. Pe Solirom, aveam acces la paginile digitalizate (PDF), putând face căutări doar după cuvântul-titlu. Dicționarul este de asemenea prezent integral pe dexonline, în format electronic, cu posibilitatea de a căuta și în definiții. Versiunea de pe dexonline este neîndoios superioară, motiv pentru care prezența acestui dicționar pe Solirom are doar o valoare istorică.

(DM) Dicționarul limbii române moderne

Publicat în 1958, acest dicționar este „părintele”, să spunem așa, al DEX-ului, apărut în 1975. A fost singurul dicționar monovolum din perioada comunistă până la apariția DEX-ului. Față de acesta, era ilustrat, mai aerisit, cu un corpus bine ales, ceea ce îl făcea mult mai atrăgător. Pe dexonline, sunt preluate doar unele articole. Deși nu mai este consultat în mod curent, uitat chiar de marele public, DM este prezent, ca și DL, pe Solirom, într-o versiune digitalizată.

(DEX 1975) Dicționarul explicativ al limbii române, ediția I

Este republicată, cu caracter muzeografic, ediția I a DEX-ului, din 1975. Este vorba de convertirea în PDF a ediției originale, dar nu putem face căutări decât după cuvinte-titlu. Faptul că și aici se folosește termenul „anastatic digital” este, în opina noastră, o eroare. Termenul „anastatic” înseamnă, conform DEX, „care reproduce o tipăritură prin imprimare sau gravare cu ajutorul anumitor procedee chimice”. Prin urmare, sigurul caz în care putem folosi termenul cu proprietate este atunci când ne referim la ediția DLR din 2010, apărută cu sprijinul BNR. În toate celelalte cazuri, DLR, DL, DM, DEX, este vorba de pagini digitalizate prin scanare și ocerizare a edițiilor publicate pe hârtie.

(DCR2) Dicționar de cuvinte recente, ediția a II-a

Acest dicționar, coordonat de Florica Dimitrescu, din 1997, este publicat în format digital, dar meniul de căutare ne limitează doar la cuvântul-titlu. El este prezent și pe dexonline, motiv pentru care publicarea lui pe Solirom este redundantă și nefolositoare, pentru că nu permite căutări în textul integral.

(TDRG3) Rumänisch-Deutsches Wörterbuch (Dicționar român-german), ediția a treia, revăzută și adăugită

Este vorba de celebrul dicționar a lui H. Tiktin, editat de Paul Miron și Elsa Lüder. Este o ediție digitală. Solirom este unicul site care disponibilizează acest dicționar cu valoare în special etimologică. Nu există soluții inteligente de căutare.

(DELR) Dicționarul etimologic al limbii române

Site-ul ne oferă, în format digital, Dicționarul etimologic al Academiei, literele A-D. Deși este o lucrare recentă, este trist faptul că nu s-au conceput soluții de căutare avansată.

(DOOM3) Dicționarul ortografic, ortoepic și morfologic al limbii române

Este ediția treia a DOOM. Ultimele două ediții se regăsesc și pe dexonline. Cu toate acestea, această aplicație a firmei One Page, cu căutări speciale, trezește interesul.

Ca observație finală, precizăm că toate dicționarele sunt aliniate. De exemplu, dacă vom căuta cuvântul „abac”, răspunsul este: DA ABÁC s. a. TDRG3 abác DLR2 ABÁC s. n. DL ABÁC s. n. DM ABÁC s. n. DELR ABÁC DOOM abac DEX1975 ABÁC s. n.

A doua secțiune este dedicată Lucrărilor lexicografice digitale. Sunt incluse două dicționare de mare interes: Dicționarul general al literaturii române, al Academiei Române, în șapte volume, dar care nu poate fi accesat, și Dicționarul literaturii române de la origini până la 1900, în ediție digitală. Consultarea se face doar cu numele autorului, neexistând din păcate posibilitatea de a căuta în interiorul articolelor, în opere etc.

Secțiunea a treia se numește Bibliografie filologică și literară românească – BFLR, unde dăm peste Bibliografia adnotată Florin Faifer, un link spre un fișier de pe Google Drive. Mărturisesc că nu am înțeles din ce motive ar trebui ca utilizatorul de pretutindeni să fie interesat (doar) de bibliografia lui Florin Faifer. În cazul în care doriți totuși să aflați ce găsim în Excel, iată: „Bibliografia rezultată are peste 1300 de titluri reflectate în 63 de categorii cuprinzând ziare, reviste, almanahuri, programe de sală, prefețe, postfețe, contribuții în volum și două dicționare monumentale: Dicționarul literaturii române până la 1900 și Dicționarul general al literaturii române.

Nu este o simplă listă de articole, ci un instrument de cercetare dinamic, conceput pe baza funcționalităților analitice puse la dispoziție de programul Excel, ce înlesnesc o mare flexibilitate structurală și direcții de studiu personalizate. Informația se bazează pe lista alcătuită de Florin Faifer și pe investigații extinse în biblioteci din țară – cu precădere BCU Iași, Biblioteca Județeană Gh. Asachi, BCU Cluj – și în colecții digitale ale revistelor, la care se adaugă validări esențiale făcute cu susținerea constantă a prietenilor și colaboratorilor lui Florin Faifer.”

A patra secțiune se numește Publicații și conține două volume: Actele Colocviului internațional „Lexicografia academică românească. Provocările informatizării” 2022 și Actele Colocviului internațional „Lexicografia academică românească. Provocările informatizării” 2023. Ambele ediții ale colocviului s-au desfășurat la Iași. Solirom ne pune la dispoziție textele intervențiilor în format PDF.

În fine, în ultima secțiune, In memoriam, este publicat necrologul lui Eugen Simion și care se încheie astfel: „Cercetătorii de la Institutul de Filologie Română „A. Philippide” al Academiei Române – Filiala Iași deplâng decesul lui Eugen Simion – acest „spirit al amplitudinii”, care le-a fost călăuză prin coordonarea unor proiecte de anvergură, la care au lucrat cu încredere și pasiune, deoarece au știut că vor contribui la mai buna cunoaștere a culturii române în lume. Prin proiectele sale, Eugen Simion a dovedit că vizionarismul și tenacitatea în conturarea și înfăptuirea unor deziderate de dimensiuni ample devin realitate menită să înfrunte timpul.”

Solirom este, așadar, o platformă care a publicat cu precădere lucrări lexicografice în versiuni digitalizate (PDF) sau digitale. Dacă la lucrările vechi, unde recuperarea textului era prea complicată putem accepta soluția de căutări doar pe bază de intrare sau cuvânt-titlu, la lucrările elaborate deja în format digital, absența unei concepții profesioniste ne pune pe gânduri. Se pretau unei rezolvări inteligente a nevoilor de căutare: DLR2, TGDR2, DCR2, DELR. Despre aceste neajunsuri, în numărul viitor.

Autor: Profesor, Dan Caragea (Lisabona-Portugalia)
Articol publicat în Occidentul Românesc, ediția lunară cu numărul 167, Anul XV.

Nota Redacției:
Dan Caragea este critic, eseist, publicist și traducător. Este lusitanist, specialist în psihologie și lingvistică computațională. Din 2011, colaborator voluntar în cadrul redacției Occidentul Românesc. Dan Caragea a absolvit Facultatea de Limba și Literatura Română (specialitate B: Limba și Literatura Portugheză). Este doctor în Psihologie. În perioada 1978-1990, a fost profesor de limba română și asistent la Facultatea de Limbi și Literaturi Străine (unde a predat limba portugheză), autor de manuale de limbă portugheză, traducător, publicând în reviste culturale din România. Între 1991 și 1993, a fost bursier al Institutul Camões din Lisabona, autor al unui manual de portugheză pentru străini, director al societății Cyberlex, responsabil pentru versiunile portugheză și spaniolă ale programului „Tropes” (analiza semantică a textului). Între 2009 și 2015 lucrează ca expert la UEFISCDI, unde realizează versiunea românească a programului „Tropes” și un software de detectare a similitudinilor (Semplag). Publică „Analiza automată a discursului”, în 2013, la Editura Academiei (coautor Adrian Curaj). În 2017 coordonează la Lisabona un mare album despre relațiile culturale și diplomatice româno-portugheze (la care este și coautor). În anii 2018-2019 este expert la Institutul de Lingvistică „Al. Rosetti – Iorgu Iordan” din București, colaborând la implementarea proiectului „Romtext” în România. Publică și în revista culturală Leviatan.