18. veljače 2021. godine održana je online radionica na temu „Kompilacija korpusa i pronalaženje stranih riječi u Sketch Engineu“. Radionica je organizirana u okviru projekta ENGRI („Engleske riječi u hrvatskome jeziku: Identifikacija, afektivno-semantičko normiranje i ispitivanje kognitivne obrade bihevioralnim i neuroznanstvenim metodama“, UIP-2019-04-1576), financiranog od strane Hrvatske zaklade za znanost.
Radionica je bila namijenjena svima koje zanima postupak kompilacije i pretraživanja korpusa. U okviru teorijskog dijela, polaznici su upoznati s alatom Sketch Engine i procesom kompilacije korpusa (doc. dr.sc. Mirjana Borucinsky, Pomorski fakultet Sveučilišta u Rijeci), nakon čega su imali prilike poslušati zanimljivo izlaganje dr. sc. Nikole Ljubešića (Institut Jožef Stefan, Slovenija), jednog od autora trenutno najopsežnijeg korpusa hrvatskog jezika, hrWaC-a, na temu „Metode izrade korpusa i obrade prirodnog jezika“. Mario Kučić (Infobip), dr. sc. Jasmina Jelčić Čolakovac (Pomorski fakultet Sveučilišta u Rijeci) i doc. dr.sc. Mirjana Borucinsky potom su polaznike proveli kroz korake izrade vlastitog korpusa, postupak ekstrakcije engleskih riječi pomoću klasifikacijskog algoritma i Sketch Enginea. Nakon toga uslijedio je praktičan rad u alatu Sketch Engine koristeći korpuse hrWaC i ENGRI, pri čemu su polaznici kroz grupni rad rješavali zadatke uz vodstvo doc. dr. sc. Mirjane Borucinsky.
Zbog velikog interesa za radionicu, broj polaznika je povećan te je ukupno sudjelovalo 38 istraživača iz različitih dijelova Hrvatske. Po završetku radionice, polaznici su izrazili svoje zadovoljstvo organizacijom i sadržajem radionice, te želju za sudjelovanjem u budućim radionicama.