Proceedings of the Second workshop on Challenges in Processing South Asian Languages (CHiPSAL2026)

LREC 2026 Workshop

Palma, Mallorca, Spain 11 - 16 May 2026 33 papers

DOI:10.63317/2wz26h6y9sun

Proceedings PDF

Show20per page

Findings of the Second Workshop on Challenges in Processing South Asian Languages (CHiPSAL 2026)

Kengatharaiyer Sarveswaran, Surendrabikram Thapa, Ashwini Vaidya, Tafseer Ahmed, Bal Krishna Bal

pp. 1-8 DOI: 10.63317/4c7g3mdcb3jv

Development of Burushaski Speech - English Text Translation Dataset

Tauqeer Saleem, Abdul Samad, Azkaa Nasir, Adina Adnan Mansoor, Fatima Faisal, Mahrukh Yousuf

pp. 9-17 DOI: 10.63317/3ujn9xefj6ca

Lost the Negation or Lost in Negation

Vennela Bairi, Parameswari Krishnamurthy

pp. 18-31 DOI: 10.63317/2erp7saprer9

A Morphological Transducer for the Limbu Language

Avyaya Singh, Jonathan N. Washington

pp. 32-39 DOI: 10.63317/32q7did7b56q

Evaluating Large Language Models for Medical Named Entity Recognition in Urdu: A Benchmark Study

Bushra Nasim, Kinza Latif, Muhammad Zohair, Muhammad Hassan Asif, Zarmeen Nasim

pp. 40-48 DOI: 10.63317/5iobohdgnfh4

DR-RAG: Addressing Retrieval Misalignment in Low-Resource Urdu Question Answering

Saad Ahmad, Muhammad Hammad, Muhammad Zeeshan, Faizad Ullah, Asim Karim

pp. 49-58 DOI: 10.63317/4wwyss5zkwxs

Cross-Domain Evaluation of Transformer-Based Models for Punjabi Speech Emotion Recognition

Fatima Tu Zahra, Kulsoom Asim, Sandesh Kumar, Abdul Samad

pp. 59-67 DOI: 10.63317/3ao5m9p6ni9x

SiPaKosa: A Comprehensive Corpus of Canonical and Classical Buddhist Texts in Sinhala and Pali

Ranidu Hansaka Gurusinghe, Nevidu Jayatilleke

pp. 68-84 DOI: 10.63317/4tbdbjqmtfj6

BNLI: A Linguistically-Refined Bengali Dataset for Natural Language Inference

Farah Binta Haque, Md Yasin, Shishir Saha, Md Shoaib Akhter Rafi, Farig Sadeque

pp. 85-91 DOI: 10.63317/2cwaxs8a7csg

Exploring Large Language Models for Multitask Learning in Bengali Text Classification

Md. Sajjad Hossain, Kawsar Ahmed, SUNY MD ASHRAF KHAN, Mohammed Moshiul Hoque

pp. 92-104 DOI: 10.63317/54y27enmr5e9

Nwāchā Munā: A Devanagari Speech Corpus and Proximal Transfer Benchmark for Nepal Bhasha ASR

Rishikesh Kumar Sharma, Safal Narshing Shrestha, Jenny Poudel, Rupak Tiwari, Arju Shrestha, Rupak Raj Ghimire, Bal Krishna Bal

pp. 105-114 DOI: 10.63317/3njkgpwzsn7k

From Romanized to Devanagari: Enhancing Nepali Sentiment Analysis with NepaliXlit

Suraj Patel, Kashish Kumari Dhami, Norden Sherpa, Supriya Khadka

pp. 115-126 DOI: 10.63317/5j8kkeb2myf6

Why Does Low-Rank Adaptation Work for Hindi-English Code-Mixing? A Geometric Analysis

Shashank Vishwakarma, Rakesh Kumar

pp. 127-136 DOI: 10.63317/55yuuwkijgj9

Hi-SEMFLOW: Lie Algebra–Based Semantic Flow for Span-Level Informal Language Identification in Hindi

Manikandan Ravikiran, Tanmay Tiwari, Vibhu Gupta, Rohit Saluja

pp. 137-153 DOI: 10.63317/2duxp4m72ddj

NeCCo: Nepali Cultural Commonsense Benchmark for Large Language Model Evaluation

Sanket Shrestha, Raunak Regmi, Sadikshya Ghimire, Satyam Rana, Supriya Khadka

pp. 154-168 DOI: 10.63317/3zsmcs7pxtgi

Reward-Guided Fine-Tuning of Whisper for Low-Resource Nepali Speech Recognition

Aadarsh Pandit, Yudhin Khanal, Ishan Pandey, Kushal Kunwar, Sunil Regmi

pp. 169-175 DOI: 10.63317/45u9hjmchyhh

Evaluating Linguistic Knowledge of LLMs in Tamil: The ILAKKANAM Benchmark

Jeyarajalingam Varsha, Menan Velayuthan, Sumirtha Karunakaran, Rasan Nivethiga, Kengatharaiyer Sarveswaran

pp. 176-189 DOI: 10.63317/23ob532xgibu

A Feature-Fusion Ensemble Approach for Tamil Hate Speech Detection

Sathasivam Nerujan, Kengatharaiyer Sarveswaran

pp. 190-197 DOI: 10.63317/2us8ubrf4jvi

Comparative Analysis of Tokenizers in Tamil Text Classification in Low Resource Settings

Gokulan Sivakumaran, Randil Pushpananda, Bandara

pp. 198-208 DOI: 10.63317/5p78kf96x2jw

Improving Public Health Safety in Low-Resource Languages Using a Human-Verified Health Misinformation Corpus and Large Language Models

Sujal Maharjan, Astha Shrestha, Laxmi Thapa, Sweta Poudel, Shuvam Shiwakoti, Rabin Thapa, Kritesh Rauniyar, Surendrabikram Thapa

pp. 209-218 DOI: 10.63317/5obqozzwbr2d

Showing 20 of 33 papers | Page 1 of 2