The Fourth Workshop on Resources and Representations for Under-Resourced Languages and Domains (RESOURCEFUL 2026)

LREC 2026 Workshop

Palma, Mallorca, Spain 11 - 16 May 2026 18 papers

DOI:10.63317/3mcee7ktdfxn

Proceedings PDF

Show20per page

Lost in Translation: Repurposing semantic similarity benchmarks for evaluating lexical-semantic consistency in LLM-based machine translation

Quin Ye, Jelke Bloem

pp. 1-12 DOI: 10.63317/3n3847mvjzk2

Bridging the Low Resource Gap in Historical Cryptology: A Multilingual Diachronic Synthetic Dataset for Reproducible Cryptanalysis

Micaella Bruton, Meriem Beloucif, Beáta Megyesi

pp. 13-24 DOI: 10.63317/2twwf4kj3cgk

Cultural Grounding in Swedish: Extending an Everyday Knowledge Benchmark for LLMs

Meriem Beloucif, Johan Sjons

pp. 25-31 DOI: 10.63317/5mct9t9w6mu2

Entity Linking for Faroese Using Large Language Models with Web Search

Annika Simonsen, Iben Nyholm Debess, Hafsteinn Einarsson

pp. 32-43 DOI: 10.63317/2myt23gboqw3

From Polyester Girlfriends to Blind Mice: Creating the First Pragmatics Understanding Benchmarks for Slovene

Mojca Brglez, Spela Vintar

pp. 44-54 DOI: 10.63317/4bpncy453r9k

SdQuAD: A Large Benchmark Question Answering Dataset for Low-resource Sindhi Language

Wazir Ali, Muhammad Rafay Shaikh, Nadia Ali, Amar Rehman

pp. 55-61 DOI: 10.63317/3dhhfxeoztgo

LLMs as Assistants for Data Annotation: Addressing Disagreement and Supporting Expert Processes

Mark Andrade, Bláithín Heffernan, Abigail Walsh, Sheila Castilho

pp. 62-72 DOI: 10.63317/4gq9fnt5umo3

Annotation Quality in Aspect-Based Sentiment Analysis: A Case Study Comparing Experts, Students, Crowdworkers, and Large Language Models

Niklas Donhauser, Jakob Fehle, Nils Constantin Hellwig, Markus Weinberger, Udo Kruschwitz, Christian Wolff

pp. 73-88 DOI: 10.63317/39nwcnfj8ypb

Cross-Lingual Mathematical Reasoning in LLMs: Evaluating Performance on Icelandic vs. English Problems

Hafsteinn Einarsson

pp. 89-95 DOI: 10.63317/5gybkk5wzk6g

Struct2Unstruct: Creating Tender NER Datasets from Structured Procurement Records using Large Language Models

Asim Abbas, Mark Lee, Niloofer Shanavas, Venelin Kovatchev, Mubashir Ali

pp. 96-106 DOI: 10.63317/3mtwxjwhaqus

Link Prediction for Event Logs in the Process Industry

Anastasia Zhukova, Thomas Walton, Christian E. Lobmüller, Bela Gipp

pp. 107-118 DOI: 10.63317/5jkczh48a2o9

MultiZebraLogic: A Multilingual Logical Reasoning Benchmark

Sofie Bruun, Dan Saattrup Smart

pp. 119-130 DOI: 10.63317/47jt2j8274nd

Progressing beyond Art Masterpieces or Touristic Clichés: how to assess your LLMs for cultural alignment?

António Branco, João Ricardo Silva, Nuno Marques, Luis M. S. Gomes, Ricardo Campos, Raquel Sequeira, Sara Nerea, Rodrigo Silva, Miguel Marques, Rodrigo Duarte, Artur Putyato, Diogo Folques, Tiago Valente

pp. 131-141 DOI: 10.63317/37qvfzetoj3r

Evaluating Large Language Model-based Natural Language Generation for Modular Dialog systems

Vincent Emmerling, Christoph Kowalski, Amelie Sophie Robrecht-Hilbig, Stefan Kopp

pp. 142-160 DOI: 10.63317/54wtdkxi95oe

JobResQA: Semi-Automatic Multilingual Benchmark Creation for LLM Machine Reading Comprehension on Résumés and Job Descriptions

Casimiro Pio Carrino, Paula Estrella, Rabih Zbib, Carlos Escolano, Jose A. R. Fonollosa

pp. 161-176 DOI: 10.63317/4pzwmqxt46xp

Beyond English and Evasion: A Human-Annotated Multi-Domain Benchmark for High-Stakes LLM Safety Evaluation in Chinese

Wajdi Zaghouani, Kholoud Khalil Aldous, Yicheng Gao

pp. 177-186 DOI: 10.63317/37ko7p43tuys

A multilingual hallucination benchmark

Freja Thoresen, Dan Saattrup Smart

pp. 187-192 DOI: 10.63317/3g94ek9qx85o

Exploring the similarities and differences between VLM-driven and traditional OCR for Historical Swedish Data

Martin Johansson, Selma Waginder, Dana Dannélls

pp. 193-199 DOI: 10.63317/4zr3kytoswtq

Showing all 18 papers