Proceedings of the Third Ukrainian Natural Language Processing Workshop (UNLP) @ LREC-COLING 2024

LREC-COLING 2024 Workshop

Turin, Italy 20 - 25 May 2024 16 papers

DOI:10.63317/5bwu58575ghh

Proceedings PDF

Show20per page

A Contemporary News Corpus of Ukrainian (CNC-UA): Compilation, Annotation, Publication

Stefan Fischer, Kateryna Haidarzhyi, Jörg Knappen, Olha Polishchuk, Yuliya Stodolinska, Elke Teich

pp. 1-7 DOI: 10.63317/33t837pync7y

Introducing the Djinni Recruitment Dataset: A Corpus of Anonymized CVs and Job Postings

Nazarii Drushchak, Mariana Romanyshyn

pp. 8-13 DOI: 10.63317/2dcvy45ws6yb

Creating Parallel Corpora for Ukrainian: A German-Ukrainian Parallel Corpus (ParaRook||DE-UK)

Maria Shvedova, Arsenii Lukashevskyi

pp. 14-22 DOI: 10.63317/4rnmjmmsncum

Introducing NER-UK 2.0: A Rich Corpus of Named Entities for Ukrainian

Dmytro Chaplynskyi, Mariana Romanyshyn

pp. 23-29 DOI: 10.63317/5mqwb7ftiezv

Instant Messaging Platforms News Multi-Task Classification for Stance, Sentiment, and Discrimination Detection

Taras Ustyianovych, Denilson Barbosa

pp. 30-40 DOI: 10.63317/4uv55pnermm6

Setting up the Data Printer with Improved English to Ukrainian Machine Translation

Yurii Paniv, Dmytro Chaplynskyi, Nikita Trynus, Volodymyr Kyrylov

pp. 41-50 DOI: 10.63317/36tfnj3sqbe9

Automated Extraction of Hypo-Hypernym Relations for the Ukrainian WordNet

Nataliia Romanyshyn, Dmytro Chaplynskyi, Mariana Romanyshyn

pp. 51-60 DOI: 10.63317/4ekekaazwpeq

Ukrainian Visual Word Sense Disambiguation Benchmark

Yurii Laba, Yaryna Mohytych, Ivanna Rohulia, Halyna Kyryleyza, Hanna Dydyk-Meush, Oles Dobosevych, Rostyslav Hryniv

pp. 61-66 DOI: 10.63317/3pn6eqt8c2n9

The UNLP 2024 Shared Task on Fine-Tuning Large Language Models for Ukrainian

Mariana Romanyshyn, Oleksiy Syvokon, Roman Kyslyi

pp. 67-74 DOI: 10.63317/57pbivswb65o

Fine-Tuning and Retrieval Augmented Generation for Question Answering Using Affordable Large Language Models

Tiberiu Boros, Radu Chivereanu, Stefan Dumitrescu, Octavian Purcaru

pp. 75-82 DOI: 10.63317/4c7u52x7u2tx

From Bytes to Borsch: Fine-Tuning Gemma and Mistral for the Ukrainian Language Representation

Artur Kiulian, Anton Polishko, Mykola Khandoga, Oryna Chubych, Jack Connor, Raghav Ravishankar, Adarsh Shirawalmath

pp. 83-94 DOI: 10.63317/5dowr7hgrb4v

Spivavtor: An Instruction Tuned Ukrainian Text Editing Model

Aman Saini, Artem Chernodub, Vipul Raheja, Vivek Kulkarni

pp. 95-108 DOI: 10.63317/59qw7bvuvej8

Eval-UA-tion 1.0: Benchmark for Evaluating Ukrainian (Large) Language Models

Serhii Hamotskyi, Anna-Izabella Levbarg, Christian Hänig

pp. 109-119 DOI: 10.63317/5m5wwkb5zzks

LiBERTa: Advancing Ukrainian Language Modeling through Pre-training from Scratch

Mykola Haltiuk, Aleksander Smywiński-Pohl

pp. 120-128 DOI: 10.63317/38s36d2i3zdo

Entity Embellishment Mitigation in LLMs Output with Noisy Synthetic Dataset for Alignment

Svitlana Galeshchuk

pp. 129-134 DOI: 10.63317/4sm99nhtbh45

Language-Specific Pruning for Efficient Reduction of Large Language Models

Maksym Shamrai

pp. 135-140 DOI: 10.63317/55g6qr4jy7ip

Showing all 16 papers