Proceedings of the SIGUL 2026 Joint Workshop with ELE, EURALI, and DCLRL "Towards Inclusivity and Equality: Language Resources and Technologies for Under-Resourced and Endangered Languages

LREC 2026 Workshop

Palma, Mallorca, Spain 11 - 16 May 2026 31 papers

DOI:10.63317/3x5d49bm2yjm

Proceedings PDF

Show20per page

How Well Do Large Language Models Reason in Under-Resourced Languages? Evidence from Vietnamese

Tuan Anh Do, Jelke Bloem

pp. 1-18 DOI: 10.63317/2a43bkurpywk

Register Sensitivity in Scalar MT Evaluation: Evidence from Spanish–Basque Informal Discourse

Nora Aranberri

pp. 19-32 DOI: 10.63317/4ig5743iz2r3

Corpus-Linguists’ Little Helpers? Evaluating LLMs for Linguistic Annotation: The Case of Sensationalist Headlines Corpus

Petra Bago, Virna Karlić

pp. 33-41 DOI: 10.63317/3zefdrpowzjr

LLM as a Morphological Disambiguator for Belarusian: A Preliminary Study

Vladislav Poritski, Oksana Volchek, Ilia Afanasev

pp. 42-48 DOI: 10.63317/3skazxbd27m8

Keyboards for the Endangered Idu Mishmi Language

Akhilesh Kakolu Ramarao

pp. 49-53 DOI: 10.63317/2furfw777daz

SAINT: Multilingual Span-Level Interpretability for Sentiment Analysis

Seid Muhie Yimam, Tadesse Destaw Belay, Robert Geislinger, Shamsuddeen Hassan Muhammad, Adaeze Ngozi Ohuoba, Sukairaj Hafiz Imam, Abinew Ali Ayele, Martin Semmann, Chris Biemann, Serge Sharoff

pp. 54-65 DOI: 10.63317/2ph93cb2qi57

AlbanianLLMSafety: A Safety Evaluation Dataset for Large Language Models in Albanian

Wajdi Zaghouani, Kholoud Khalil Aldous, Isra Fejzullaj

pp. 66-73 DOI: 10.63317/42i5uiy6yyqq

Urdu-CLEVR: A Novel Benchmark for Visual Reasoning in an Under-Resourced Linguistic Context

Sohail Ashraf, Adeel Zafar, Slawomir Nowaczyk, Ahthasham Sajid

pp. 74-82 DOI: 10.63317/4ow3ni9a2kiw

A Database of Romance Clitics With Speech Samples

Abdelrahim Qaddoumi, Owen Rambow, Lori Repetti, Francisco Ordóñez

pp. 83-93 DOI: 10.63317/5azno6dg9d4p

GreekCommonGen: A Benchmark for Evaluating Generative Commonsense Reasoning in Greek

Aristotelis Stamopoulos, Dimitrios Galanis

pp. 94-100 DOI: 10.63317/2izsrnej2bs7

Transfer Learning for Creole TTS: A Pilot Study on Whether Substrate Phonologies or Lexifier Vocabularies Matter More

Emmett Strickland, Marc Evrard, Valentina Fedchenko

pp. 101-106 DOI: 10.63317/5d5qjmokuvmc

KZ-SafetyPrompts: A Kazakh Safety Evaluation Prompt Dataset for Large Language Models

Wajdi Zaghouani, Shimaa Amer Ibrahim, Aruzhan Muratbek, Olzhasbek Zhakenov, Adiya Akhmetzhanova

pp. 107-118 DOI: 10.63317/322e8tcej745

SimLex-999 for Modern Greek

Leonidas Mylonadis, Jelke Bloem

pp. 119-125 DOI: 10.63317/2ynm43iouxft

Quality and Appropriateness of Large Text Datasets for Irish NLP

Abigail Walsh, Mark Andrade, Jane Lauren Adkins, Ornait O'Connell, Éanna O'Connor, Ellen Rushe, Brian Davis

pp. 126-142 DOI: 10.63317/3sxe9j64u492

BiST: A Gold Standard Bangla-English Bilingual Corpus for Sentence Structure and Tense Classification with Inter-Annotator Agreement

Abdullah Al Shafi, Swapnil Kundu Argha, M. A. Moyeen, Abdul Muntakim, Shoumik Barman Polok

pp. 143-152 DOI: 10.63317/45p9gc5atu9s

LLM-Assisted Spanish Dialect Corpus Construction

Jessica Claribel RAMIREZ VIDAL, Hiroki Ouchi, Sakriani Sakti

pp. 153-159 DOI: 10.63317/3zod9jyperib

Structured Entity Extraction from Hawaiian Television Chyrons Using Vision-Language Models

Kelley Lynch, Owen King, Kyeongmin Rim, Gabrielle Keen, Yangyang Chen, James Pustejovsky

pp. 160-168 DOI: 10.63317/4vjma77xc4kh

Towards a general theory of linguistic diversity

Steven Bird

pp. 169-182 DOI: 10.63317/27xpbzgmsuxp

Interlinear Glosses as a Multilingual Pivot for Machine Translation: An Updated Study on Turkish with Restricted Resources

Volkan Ozer, Shu Okabe, Alexander Fraser

pp. 183-197 DOI: 10.63317/4km7f5p8epxt

Benchmarking Multilingual LLM Translation Accuracy for Fuzhounese

Sue Zheng, Jelke Bloem

pp. 198-209 DOI: 10.63317/4mm9bs8yy4ie

Showing 20 of 31 papers | Page 1 of 2