MSZNY 2022
XVIII. Magyar Számítógépes Nyelvészeti Konferencia.
A Szegedi Tudományegyetem Informatikai Intézete tizennyolcadik alkalommal rendezi meg a Magyar Számítógépes Nyelvészeti Konferenciát. A konferencia a nyelvtechnológia területén végzett kutatások és eredményeik ismertetésének ad otthont. Fő célja az elvégzett vagy folyamatban lévő kutatások és fejlesztések legaktuálisabb eredményeinek bemutatása, de lehetőség nyílik hallgatói projektek, ill. a nyelvtechnológia ipari alkalmazásainak ismertetésére is.
A Számítógépes Nyelvészeti Konferencia fő célja a területen végzett kutatásoknak és eredményeinek bemutatása. A konferenciára elsősorban az alábbi témakörökben várunk cikkeket magyar vagy angol nyelven: Morfológiai és szintaktikai elemzés Ontológiák, korpusznyelvészet Szemantikai annotáció és elemzés, jelentés-egyértelműsítés, névelem-felismerés Információkinyerés, információ-visszakeresés, szövegbányászat, szemantikus keresés Gépi fordítás Beszédfelismerés és -szintézis Nyelvi intelligenciára épülő egyéb alkalmazások A plenáris előadásokon kívül interaktív szekciókat is rendezünk, ahol az előadók poszter-, ill. laptopos bemutatót tartanak. Itt is elsősorban a fenti témakörökhöz kapcsolódó munkák beküldését várjuk.
A konferencia programja:
CSÜTÖRTÖK
9:00-9:15 Megnyitó (Ács Judit, Berend Gábor)
9:15-10:55 Nyelvmodellek (szekcióelnök: Kornai András)
9:15-9:35 Berend Gábor: Nyelvspecifikus transzformer modellek közötti megfeleltetéssel történő zero-shot jelentésegyértelműsítés 9:35-9:55 Yang Zijian Győző: BARTerezzünk! Messze, messze, messze a világtól – BART kísérleti modellek magyar nyelvre 9:55-10:15 Indig Balázs, Lévai Dániel: Okosabb vagy, mint egy XXXXXXXX? — Egy nyelvi játéktól a nyelvmodellek összehasonlításáig 10:15-10:35 Ficsor Tamás, Cserháti Réka, Novák Attila, Mihajlik Péter, Zainkó Csaba, Berend Gábor: Charmen ELECTRA: Tokenizációmentes diszkriminatív nyelvi modellezés 10:35-10:55 Orosz György, Szántó Zsolt, Berkecz Péter, Szabó Gergő, Farkas Richárd: HuSpaCy: an industrial-strength Hungarian natural language processing toolkit
11:15-12:35 Szintaxis (szekcióelnök: Szécsényi Tibor) 11:15-11:35 Pethő Gergely, Sass Bálint, Kalivoda Ágnes, Simon László, Lipp Veronika: Igekötő-kapcsolás 11:35-11:55 Bajzát Tímea Borbála, Szemes Botond, Szlávich Eszter: Adalékok a birtokos szerkezetekbe sűrített hasonlatok számítógépes azonosításához 11:55-12:15 Makrai Márton: Three-order normalized PMI and other lessons in tensor analysis of verbal selectional preferences 12:15-12:35 Nemeskey Dávid Márk: An introductory statistical study of Hungarian word order
13:35-14:35 plenáris előadás (szekcióelnök: Vincze Veronika) Ződi Zsolt: A mesterséges intelligencia szabályozása és jogi felhasználásai [prezentáció]
14:35-16:05 Poszterek és laptopos bemutatók 1. (szekcióelnök: Farkas Richárd) 12. Szeteli Ádám, Friedszám Attila, Szeteli Anna, Kárpáti Laura, Hagymási Judit, Kleiber Judit, Alberti Gábor: A kétrétegű dinamikus pragmatika implementációja 7. Yang Zijian Győző: “Az invazív medvék nem tolerálják a suzukis agressziót” – Magyar GPT2 kísérleti modell 5. Naszódi Mátyás: Lehet-e automatikus családfaépítő programot készíteni? 14. Üveges István, Ring Orsolya: A CLARIN ParlaMint magyar korpusza 46. Makrai Márton, Tündik Máté Ákos, Indig Balázs, Szaszák György: Towards abstractive summarization in Hungarian 11. Üveges István, Csányi Gergely Márk, Ring Orsolya, Orosz Tamás: Szövegaugmentálási módszerek összehasonlítása politikai szövegek szentimentanalízise során 24. Szécsényi Tibor, Virág Nándor: Az ige helyhatározói bővítményeinek megkülönböztetése és az argumentumszerkezeti variánsok korpusz alapú szétválasztása 18. Novák Attila, Novák Borbála: NerKor 1.41e
16:25-18:25 Beszédtechnológia (szekcióelnök: Kovács György) 16:25-16:45 Jenei Attila Zoltán, Sztahó Dávid: Length Analysis of Speech to be Recorded in the Recognition of Parkinson’s Disease 16:45-17:05 Gosztolya Gábor, Tóth László, Svindt Veronika, Bóna Judit, Hoffmann Ildikó: Sclerosis Multiplex hangalapú felismerése akusztikai alapú beágyazások használatával 17:05-17:25 Terbe Dániel, Tóth László, Ivaskó Lívia: Hangkorverzió alkalmazása dysarthriás betegek beszédminőségének javítására 17:25-17:45 Vetráb Mercedes, José Vicente Egas-López, Balogh Réka, Imre Nóra, Hoffmann Ildikó, Tóth László, Pákási Magdolna, Kálmán János, Gosztolya Gábor: Enyhe kognitív zavar automatikus felismerése szekvenciális autoenkóder használatával 17:45-18:05 Arthur Frigyes Viktor, Csapó Tamás Gábor: Deep learning alapú agyi jel feldolgozás és beszédszintézis előkészítő munkálatai 18:05-18:25 Mihajlik Péter, Balog András, Gráczi Tekla, Kohári Anna, Fegyó Tibor, Mády Katalin: Releasing the BEAST – A BEA gépi beszédleiratozási feladat, megközelítések és eredmények
PÉNTEK
9:00-11:00 Alkalmazások (szekcióelnök: Prószéky Gábor) 9:00-9:20 Ferenczi Zsanett: Nyelvtanulást elősegítő feladatok automatikus előállítása finn és magyar nyelvekre 9:20-9:40 Cserháti Réka, Kolláth István, Kicsi András, Berend Gábor: Magyar nyelvű Fedőnevek-ágensek létrehozása nyers szövegek alapján épített gráf felhasználásával 9:40-10:00 Agócs Ádám, Yang Zijian Győző: Absztraktív összefoglaló PreSumm módszerrel 10:00-10:20 Kenyeres Ádám, Kovács György: Twitter bot detection using deep learning 10:20-10:40 Sztahó Dávid, Beke András, Szaszák György, Fejes Attila: Forensic Authorship Classification by Paragraph Vectors of Speech Transcriptions 10:40-11:00 Kahla Mram, Yang Zijian Győző: Absztraktív összefoglalás arab nyelvre
11:20-12:50 Poszterek és laptopos bemutatók 2. (szekcióelnök: Novák Attila) 48. Csanády Bálint, Lukács András: Lightweight diacritic restoration for V4 languages 26. Szécsényi Tibor, Kovács Viktória: Dinamikus szemantikai modell megszorított predikátumokkal 37. Kelemen Sára Bernadett, Yang Zijian Győző, Kmetty Zoltán: Neme? Nemek közötti nyelvhasználati különbségek a Facebook bejegyzésekben 16. Orosz Tamás, Csányi Gergely Márk, Gadó Krisztián, Üveges István, Vági Renátó, Vadász János Pál, Nagy Dániel: Vállalati rendszerbe integrálható természetesnyelv-feldolgozó alkalmazás készítése digital-twin-distiller platformmal 17. Yang Zijian Győző, Feldmann Ádám, Váradi Tamás: A kis HIL-ELECTRA, HIL-ELECTRIC és HIL-RoBERTa – Magyar kísérleti nyelvi modellek tanítása kevés erőforrással 2. Üveges István: Közérthetőség mint osztályozási probléma (?) – gépi tanulási kísérlet kézzel címkézett korpuszon 32. Nagy Soma Bálint, Herdinai Viktor, Pálfi Gellért, Fegyó Tibor, Mihajlik Péter, Farkas Richárd: Magyar nyelvű időpont-egyeztető dialógusrendszer v2 15. Cserháti Réka, Kolláth István, Kicsi András, Berend Gábor: Magyar nyelvű Fedőnevek-ágensek létrehozása nyers szövegek alapján épített gráf felhasználásával
13:50-15:30 Szemantika, gépi fordítás (szekcióelnök: Oravecz Csaba) 13:50-14:10 Laki László János, Yang Zijian Győző: Mondatszintű szentiment analízis teljesítményének javítása adatkiterjesztéses eljárásokkal 14:10-14:30 Osváth Mátyás, Yang Zijian Győző, Kósa Karolina: Magyar páciensek narratív tapasztalatainak elemzése BERT témamodellezéssel és szentimentelemzéssel 14:30-14:50 Szabó Martina Katalin, Vincze Veronika, Ring Orsolya, Guba Csenge: Nagyot mondó képviselők? Fokozás a politikai kommunikációban 14:50-15:10 Nagy Attila, Patrick Nanys, Frey Balázs Konrád, Bial Bence, Ács Judit: Syntax-based data augmentation for Hungarian-English machine translation 15:10-15:30 Laki László János, Yang Zijian Győző: Jobban fordítunk magyarra, mint a Google!
15:50-16:50 kerekasztal
17:00-18:40 Korpusz, szövegfeldolgozás (szekcióelnök: Csirik János) 17:00-17:20 Horváth Péter, Kundráth Péter, Indig Balázs, Fellegi Zsófia, Szlávich Eszter, Bajzát Tímea Borbála, Sárközi-Lindner Zsófia, Vida Bence, Karabulut Aslihan, Timári Mária, Palkó Gábor: Az ELTE Verskorpusz – a magyar kanonikus költészet gépileg annotált, kereshető adatbázisa 17:20-17:40 Simon Eszter, Vadász Noémi, Lévai Dániel, Nemeskey Dávid, Orosz György, Szántó Zsolt: Az NYTK-NerKor több szempontú kiértékelése 17:40-18:00 Novák Attila, Novák Borbála: NerKor 1.41e 18:00-18:20 Laki László János, Kőrös Ádám, Ligeti-Nagy Noémi, Nyéki Bence, Vadász Noémi, Yang Zijian Győző, Váradi Tamás: OCR hibák javítása neurális technológiák segítségével 18:20-18:40 Ligeti-Nagy Noémi, Ferenczi Gergő, Héja Enikő, Jelencsik-Mátyus Kinga, Laki László János, Vadász Noémi, Yang Zijian Győző, Váradi Tamás: HuLU: magyar nyelvű benchmark adatbázis kiépítése a neurális nyelvmodellek kiértékelése céljából 18:40-19:00 zárás (Simon Eszter)