Медиите блокират изкуствения интелект

Над половината (57%) от уебсайтовете на старите печатни издания са блокирали обхождащите устройства на OpenAI до края на 2023 г., в сравнение с 48% от телевизионните и радиопредаванията и около една трета (31%) от дигиталните издания.

Институт Ройтерс (Reuters Institute) разкрива информация за водещи новинарски уебсайтове в десет държави, които блокират обхождащите устройства с изкуствен интелект. Компании като OpenAI (създаваща ChatGPT) и Google (създаваща Gemini, наричана преди Bard) използват обхождащи устройства, за да извличат данни от уебсайтове и да обучават големи езикови модели (LLM). Те могат да се използват и за извличане на информация от уебсайтове в реално време в отговор на заявки на потребителите. Но ако уебсайтовете изберат да блокират обхождащите устройства (и не се постигне друга договореност), нищо от това не е позволено, което има последици за качеството на основните модели и способността им да извличат информация от мрежата.

Уеб обхождащите програми (понякога наричани "паяци" или "ботове") автоматично преглеждат мрежата, като систематично събират данни в процеса на работа. Те могат да се използват за различни цели. Например търсачките разчитат на данните, събрани от техните уеб обхождащи устройства, за да индексират страниците в мрежата и да отговарят бързо на заявките за търсене.

Изследването показва, че до края на 2023 г. около половината от най-използваните новинарски уебсайтове в десет държави блокират OpenAI и търсачките с изкуствен интелект на Google. Освен това тези, които блокират, са непропорционално повече от наследените печатни издания и издания с по-голям обхват. Това означава, че по-новите модели е по-малко вероятно да бъдат обучени на новинарски продукти от издателите на вестници и списания, както и от тези издания, които са по-широко използвани от обществеността. Това може да има последици както за качеството, така и за релевантността на резултатите от ИИ, когато става въпрос за новини, както от самите модели, така и по отношение на това, което те могат да извлекат от интернет.

Важно е обаче да се има предвид, че това е само моментна снимка на ситуацията в края на 2023 г. Това е бързо развиваща се област и ситуацията вероятно ще се промени, дори в краткосрочен план, особено след като някои издатели се стремят да сключат сделки с компании за изкуствен интелект и непрекъснато се разработват нови продукти.

Цялото изследване можете да прегледате чрез връзката поставена по-долу.

Колко новинарски уебсайтове блокират обхождащите устройства с изкуствен интелект? | Ройтерс Институт за изследване на журналистиката

reutersinstitute.politics.ox.ac.uk/how-many-news-websites-block-ai-crawlers

How many news websites block AI crawlers? | Reuters Institute for the Study of Journalism

Reuters Institute for the Study of Journalism