tim-mossholder-clN4DePMfm4-unsplash

Nowe podejście AI do analizy językowej.

Woooof

Jednym z największych wyzwań dla sztucznej inteligencji przetwarzającej język jest ustalenie podstawowego znaczenia slangu, kolokwializmów i celowych błędów ortograficznych.

Aby pomóc tym nieszczęśliwym maszynom, zespół matematyków z University of Vermont zaczął analizować, jak młodzi ludzie celowo rozciągają słowa podczas pisania. Na przykład oszacowali różnicę semantyczną między rozciągniętymi słowami, takimi jak „hahaha” i „haaahaha” w nadziei, że przyszłe algorytmy sztucznej inteligencji mogą nauczyć się rozumieć nas w nieformalny sposób, w jaki faktycznie komunikujemy się online.

Ukryte Znaczenie

W swoich badaniach , opublikowanych w środę w czasopiśmie PLOS One , zespół przeanalizował tak zwane „rozciągliwe słowa”, które pojawiły się w 100 miliardach tweetów opublikowanych w ciągu ostatnich ośmiu lat. Następnie wymyślili dwa pomiary: równowagę i rozciągnięcie. Na przykład „lololol” ma wysoką wartość bilansową, podczas gdy „nooooo” nie, ponieważ powtarzana jest tylko jedna litera.

To mogłoby pomóc algorytmom – i przyszłym historykom – zrozumieć, że „koleś” odnosi się do osoby, podczas gdy „duuuude” jest synonimem „yike”.

Zaktualizowany Leksykon

Ostatecznie naukowcy twierdzą, że nasze słowniki nie odzwierciedlają sposobu, w jaki ludzie się komunikują, a zrozumienie rozciągniętych słów popularnych w mediach społecznościowych może wypełnić ważną lukę w wiedzy.

„Byliśmy w stanie kompleksowo zbierać i liczyć rozciągnięte słowa, takie jak„ gooooooaaaalll ”i„ hahahaha ”- stwierdzili naukowcy w komunikacie prasowym – i mapować je na dwa wymiary ogólnej rozciągliwości i równowagi rozciągania, jednocześnie opracowując nowe narzędzia, które pomoże również w dalszych badaniach lingwistycznych oraz w innych obszarach, takich jak przetwarzanie języka, rozszerzanie słowników, ulepszanie wyszukiwarek, analiza budowy sekwencji i wiele innych.”

Źródło: https://futurism.com/the-byte

Tagi: , , ,
poprzedni
następny

Dodaj komentarz

Twój adres email nie zostanie opublikowany. Pola, których wypełnienie jest wymagane, są oznaczone symbolem *