Doğal dil işleme (DDİ), doğal dillerin bilgisayarlar tarafından işlenip analiz edildiği bir yapay zekâ ve hesaplamalı dilbilim alt alanıdır. Verideki artış ve uygulamaların yer alabileceği alanların artması, bu konudaki araştırmaların hızla önem kazanmasını sağlamaktadır. Son yıllarda, DDİ, teknik alanlarda olduğu kadar sosyal ve toplum bilimleri gibi alanlarda da teknoloji kullanımını yaygınlaştırmada öne çıkmaktadır.
Bununla birlikte giderek gelişen yapay zeka tabanlı DDİ uygulamaları çeşitli etik, açıklanabilirlik, şeffaflık ve yorumlanabilirlik sorunlarını karşımıza çıkartmaktadır. Bir başka deyişle, insanlar olarak sadece DDİ özelinde değil tüm yapay zeka tabanlı algoritmalarımızın vardıkları sonuçlara neden ulaştıklarını bilmemiz gerekmektedir.
DDİ alanında ise açıklanabilirliğin ön plana çıktığı konulardan birisi kelime temsillerinin yorumlanabilirliğidir. Yukarıda bahsedilen DDİ uygulamalarının yapılabilmesi için, metinlerin bilgisayarların işleyebileceği bir formata aktarılabilmesi için doğal dilin özelliklerinin matematiksel olarak dijital ortamda ifade edilmesi gerekmektedir. Kelime temsilleri, dildeki kelimelerin çok boyutlu bir uzayda temsil edilmesidir. Kelime temsilleri, DDİ uygulamalarının daha kolay ve hızlı gerçekleştirilmesinde bir yapıtaşı olarak görev alarak büyük bir rol oynamaktadır. Kritik yapıtaşı olarak kullanılmaları nedeniyle, kelime temsillerinin yorumlanabilirliği, açıklanabilirliği ve çeşitli önyargıları barındırıp barındırmadıkları giderek önem kazanan bir araştırma alanıdır.
Projelerimizde, kelime temsilleri üzerinde yorumlanabilirlik, açıklanabilirlik ve önyargılardan arındırma açısından yenilikçi metotlar geliştirerek hayatımıza giderek giren yapay zeka uygulamalarının etik kaygılarını gidermeye çalışmaktayız.
Örnek Yayınlar:
Senel, L. K., Utlu, I., F. Sahinuc, H. M. Ozaktas, and A. Koç, 2020. “Imparting Interpretability to Word Embeddings while Preserving Semantic Structure”, Natural Language Engineering, Cambridge University Press, pp. 1-26.
Senel, L. K., Utlu, I., Yucesoy, V., Koç, A., and Çukur, T. 2018a. “Semantic Structure and Interpretability of Word Embeddings,” IEEE/ACM Transactions on Audio, Speech and Language Processing, vol. 26, no. 10, pp. 1769-1779.
Yucesoy, V., and Koç, A., 2019. “Co-occurrence Weight Selection in Generation of Word Embeddings for Low Resource Languages,” ACM Transactions on Asian and Low-Resource Language Information Processing, vol. 18, no. 3, Article 22.
Senel, L. K., Yucesoy, V., Koç, A., and Çukur, T., 2017. “Measuring cross-lingual semantic similarity across European languages”, 40th International Conference on Telecommunications and Signal Processing (TSP), Barcelona, Spain.
Senel, L. K., Utlu, I., Yucesoy, V., Koç, A., and Çukur, T. 2018b. “Generating Semantic Similarity Atlas for Natural Languages”, IEEE Workshop on Spoken Language Technologies, Athens, Greece.