Каб паўплываць на алгарытмы «Google», трэба змяніць мадэль паводзінаў у інтэрнэце цэлай нацыі


Праблема выкарыстання беларускай мовы ў сэрвісах кампаніі «Google» цягам гадоў застаецца без развязання: беларуская не ўваходзіць у пералік моваў, якія падтрымліваюцца кампаніяй. У выніку гэта ўсё стварае праблемы беларусам – як з атрыманнем беларускамоўнага кантэнту, гэтак і з яго прасоўваннем. Ці можна гэтаму даць рады і што кожны з нас можа зрабіць на сваім узроўні? Паспрабавалі разабрацца.

Здымак мае ілюстрацыйны характар.
Фота: pexels.com

Праблема

Тое, што «Google» з беларускаю моваю «не сябруе», – праблема зусім не новая. Яна перыядычна ўздымаецца ў медыях, але пасля кароткага абмеркавання зноў патанае ў багне аргументаў: маўляў, беларусы самі мала карыстаюцца сваёй мовай, а кампаніі неабходна трымаць вялізны штат супрацоўнікаў, каб забяспечваць паўнавартаснае функцыянаванне беларускай мовы на сваёй платформе. Гэта эканамічна нявыгадна. Таму – усё разумеем, але бізнес ёсць бізнес.

Яшчэ ў 2019 годзе Франак Вячорка, які на той момант займаў пасаду віцэ-прэзідэнта «Digital Communication Network» падкрэсліваў, што «Google» пахаваў беларускую мову.

«Google» сапраўды не прапускае беларускамоўных ролікаў на рэкламу ў YouTube ды іншыя свае платформы. Яны лічаць, што мала кантэнту ствараецца на гэтай мове, яны спынілі падтрымку, яны перасталі наймаць людзей, якія вычытваюць гэтую мову. І сапраўды беларускамоўным каналам і медыям немагчыма раскруціцца, бо кантэнт папросту не прапускаюць. Гэта дурасць», – адзначаў Вячорка ў інтэрв’ю з Алінай Коўшык на «Белсаце».

У выніку праблемы з беларускамоўным кантэнтам у сэрвісах «Google», якія мы сёння маем, гэтак і застаюцца неразвязанымі.

Кропля ў моры расейскамоўнага кантэнту

Праблема першая – беларускамоўны змест тоне ў моры кантэнту расейскамоўнага. Пераважна праз тое, што расейскамоўны кантэнт праходзіць індэксацыю непараўнальна хутчэй, чымся нават ідэнтычны кантэнт, але створаны па-беларуску. Індэксацыяй называецца працэс збору, аналізу і захоўвання звестак з сайтаў і наступнае іх дадаванне на старонкі пошукавых сістэмаў. Без індэксацыі сайты і кантэнт на іх папросту не могуць адлюстроўвацца ў выніках пошукавікаў – будзь то «Google», «Yahoo», «Яндэкс» ці які іншы.

Гэта цягне за сабою наступную праблему, якую ў 2022 годзе добра апісала выданне «Media IQ»: беларускія медыі, найперш незалежныя (якія якраз часцей карыстаюцца беларускаю моваю), вельмі слаба рэпрэзентаваныя ў сэрвісах «Google» і пры асвятленні міжнародных падзеяў практычна ігнаруюцца. У выніку беларусы застаюцца пад уплывам расейскага медыяполя.

Напрыклад, аналітыкі выдання робяць выснову, што «беларускі погляд на ўкраінска-расейскую вайну практычна не прэзентаваны ў выдачы «Google» для беларускага карыстальніка», нягледзячы на тое, што Zerkalo.io і «Белсат» штодзённа публікуюць зводкі з украінскага фронту.

Праблема з рэкламаю

Наступная праблема – немагчымасць даваць рэкламу па-беларуску ў сэрвісе «Google Ads».

Яшчэ ў 2018 годзе кампанія абмежавала магчымасць платнага прасоўвання відэакантэнту ў YouTube спісам з 44 моваў (сёння ён павялічыўся да 51), у якім беларуская мова адсутнічае. Паводле ўсталяваных тады правілаў, як падкрэсліваў Франак Вячорка, мадэратары павінны былі правяраць відэакантэнт на прадмет распальвання нянавісці і фэйкаў. У выніку беларускамоўны кантэнт перастаў праходзіць мадэрацыю, бо мова не падтрымліваецца, а ўсе, хто працаваў на ёй, сутыкнуліся з праблемай і страцілі аўдыторыю.

Здымак мае ілюстрацыйны характар.
Фота: freepik.com

Усё гэта прывяло да таго, што ролікі па-беларуску, размешчаныя на гуглаўскім сэрвісе YouTube, не манетызуюцца, а іх стваральнікі не атрымліваюць грошы. Спосабам абысці гэта стала тое, што на беларускамоўных YouTube-каналах назвы відэа ды іх апісанні даюцца па-расейску. Пакуль што толькі такі спосаб дазваляе прасоўваць уласны беларускамоўны кантэнт беларускім карыстальнікам, хоць выглядае гэта вельмі дзіўна.

У чым рэч

Адна з найбольш відавочных прычынаў адмовы ад мадэрацыі кантэнту на беларускай мове – фінансавы чыннік. Для адсочвання ўсяго, што выходзіць па-беларуску, кампаніі «Google» неабходна набраць дадатковых супрацоўнікаў у каманду. Але, паколькі кантэнту па-беларуску ствараецца не вельмі шмат у параўнанні з расейскамоўным ці нават украінскамоўным, то акупіць заробак створанай каманды будзе праблематычна. Такую пазіцыю выказаў кіраўнік Асацыяцыі прафесійных карыстальнікаў сацыяльных сетак і мэсэнджараў Уладзімір Зыкаў у інтэрв’ю «Коммерсанту». «Не будзе столькі кантэнту, каб акупіць хаця б заробак мадэратарам», – адзначыў ён некалькі гадоў таму.

Наступная прычына – «Google» не вылучае нашай краіны як асобны рэгіён і не дапамагае шукаць навінаў па-беларуску, адпаведна Беларусь трапляе ў медыйнае поле Расейскай Федэрацыі, бо ў нашай краіне расейская мова – другая дзяржаўная.

Але ёсць яшчэ дзве прычыны, якія прывялі да таго, што «Google» не лічыць неабходным залучаць беларускую ў спіс моваў, якія падтрымліваюцца. Адна даволі празаічная: беларусы не карыстаюцца беларускаю мовай і набіраюць у пошуку запыты па-расейску, а другая – калі беларусы набіраюць запыт па-беларуску, то колькасць беларускамоўнага кантэнту, які яны атрымліваюць у выдачы, мізэрная. Чаму? Бо гэтага кантэнту вельмі мала.

Адпаведна алгарытмы «Google» і YouTube прапануюць карыстальнікам разам з некалькімі спасылкамі сайтаў па-беларуску цэлую процьму расейскамоўнага кантэнту. І гэта тая праблема, з якой мы пачалі наш артыкул.

Такім чынам, атрымліваецца дылема кшталту «яйка ці курыца»: беларусы не карыстаюцца беларускамоўным кантэнтам, бо алгарытмы «Google» не адлюстроўваюць яго ў пошуку, ці гэта кантэнт не індэксуецца, бо беларусы ім не цікавяцца?

Украінскі досвед

Нашыя паўднёвыя суседзі мелі (дый насамрэч маюць і цяпер) праблемы падобнага парадку: алгарытмы «Google» выдавалі непрапарцыйна шмат расейскамоўнага кантэнту ў параўнанні з украінскамоўным. І гэта нягледзячы на шматгадовую дзяржаўную моўную палітыку і больш высокі адсотак свядомых украінцаў, дзякуючы чаму кантэнту на роднай мове ва Украіне стваралася куды больш, чымся ў Беларусі. Пры гэтым трэба адзначыць, што ўкраінскую мову «Google» якраз падтрымлівае.

Моцна змяніў сітуацыю пачатак поўнамаштабнай вайны ў 2022 годзе: расейская агрэсія справакавала імкненне вялікай колькасці ўкраінцаў свядома адмаўляцца ад мовы акупантаў. Гэта адлюстравалася і ў паводзінах украінскіх карыстальнікаў у інтэрнэце: яны сталі рабіць больш запытаў на роднай мове і шукаць больш украінскамоўнага зместу.

Пра гэта сведчаць даследаванні: згодна з апытаннем Кіеўскага інстытуту сацыялогіі, атрымліваецца, што колькасць карыстальнікаў украінскай мовы ў інтэрнэце істотна павялічылася ў 2022 годзе ў параўнанні з 2017-м, у той час як выкарыстанне расейскай мовы значна зменшылася.

Колькасць украінцаў, якія выкарыстоўвалі ўкраінскую і расейскую мовы ў інтэрнэце, у 2017 і 2022 гадах. Крыніца: zn.ua

Пацвярджаецца гэта і нашым уласным аналізам: мы паглядзелі ў «Google Analytics» статыстыку выкарыстання некаторых параў словаў па-ўкраінску і па-расейску ў перыяд са студзеня 2021 да верасня 2023 года (для параўнання былі ўзятыя слоўныя пары з высокаю частатою выкарыстання):

  • новости / новіни,
  • война / війна,
  • Зеленский / Зеленьський,
  • Путин / Путін,
  • помощь / допомога,
  • раненый / поранений.

На графіку 1 адлюстраваныя расейскамоўныя запыты з выкарыстаннем гэтых словаў. На графіку 2 – украінскамоўныя.

Графік 1. Колькасць расейскамоўных запытаў з выкарыстаннем выбаркі частотных словаў. Крыніца: Белсат
Графік 2. Колькасць украінскамоўных запытаў з выкарыстаннем выбаркі частотных словаў. Крыніца: Белсат

Як відаць, да поўнамаштабнага ўварвання Расеі ва Украіну (пазначаны пікам на графіках) колькасць запытаў што па-расейску, што па-ўкраінску вагалася каля 1,8 мільёна карыстальнікаў. Але пасля лютага 2022 года ўкраінскамоўныя запыты сталі пераважаць, і ў выніку з парытэту 50 на 50 гэтая прапорцыя стала выглядаць як 30 на 70 на карысць украінскай мовы.

На фоне высокай запатрабаванасці ўкраінскай мовы і росту яе папулярнасці ўкраінскія медыі сталі актыўна публікаваць артыкулы з рэкамендацыямі, як зменшыць колькасць расейскага кантэнту або наагул выключыць яго пры пошуку інфармацыі ў «Google».

Сярод іншага, там ёсць рэкамендацыі, якія могуць быць выкарыстаныя і беларусамі: напрыклад, змяніць у наладах акаўнту «Google» (ў меню «Асабовая інфармацыя») мову на беларускую; выдаліць з прыярытэтных моваў расейскую мову (гэта будзе абазначаць, што вы будзеце бачыць менш кантэнту па-расейску). У гэтым жа меню можна адключыць аўтаматычнае даданне моваў (бо алгарытмы «Google» будуць ведаць, што вы валодаеце расейскаю мовай, і могуць пазней дадаць яе аўтаматычна). Таксама рэкамендуецца ачысціць кэш і гісторыю браўзера, а таксама файлы «cookie».

Цэлая нацыя адначасова змяніла свае паводзіны пры пошуку ў інтэрнэце, і гэта дало свае вынікі: цяпер адзначаецца, што алгарытмы кампаніі «Google» сталі выдаваць у пошуку больш украінскага кантэнту.

Але ці развязала гэта ўсё праблему цалкам? Калі судзіць з таго, што ў канцы кастрычніка 2023 года жонка прэзідэнта Украіны Алена Зяленская падчас сустрэчы з прадстаўнікамі «Google» звярнулася да кіраўніцтва карпарацыі з просьбаю дэрусіфікаваць пошукавую сетку, а таксама рэкамендацыі ў YouTube, то можна меркаваць, што пытанне застаецца вострым дасюль. І гэта нягледзячы на вайну, жаданне ўкраінцаў адмежавацца ад усяго, што звязана з Расеяй, і актыўныя дзеянні, каб змяніць алгарытмы «Google».

А што беларусы?

Беларусы, якія разумеюць актуальнасць праблемы, таксама неаднаразова рабілі спробы развязаць гэтае пытанне.

Яшчэ ў 2019 годзе прадстаўнікі беларускай медыясупольнасці, у тым ліку галоўныя рэдактары буйных онлайн-выданняў, выступілі з ініцыятываю Дэкларацыі аб неабходнасці геаграфічнай лакалізацыі інтэрнэт-сэрвісаў і прызнання інтэрнэт-сегменту Беларусі асобным рынкам. Падпісанты дэкларацыі ставілі сваёй мэтаю дамагчыся ад глабальных інтэрнэт-карпарацыяў прызнання Беларусі ў якасці асобнага рынку і геаграфічна лакалізаваць сэрвісы.

У 2020 годзе таксама стварылі асобную петыцыя на Change.org, якую падпісалі амаль 32 тысячы чалавек і адправілі ў амерыканскі офіс «Google». Яе стваральнік Дзмітрый Бурдыка сутыкнуўся з тым, што «Google Ads» не хоча даваць рэкламу на беларускай мове, «хаця разумее яе і распазнае». У суправаджэнні да петыцыі яе стваральнік пісаў, што ўсе спробы даць рэкламу блакуюцца, і адзначаў немагчымасць даць спасылку на старонку сайту на беларускай мове.

Анэтэ Крэбэр-Рыль, Святлана Ціханоўская і Лэслі Мілер.
Фота: прэс-служба Ціханоўскай

У лютым 2023 года абраная прэзідэнтка Беларусі Святлана Ціханоўская і прадстаўнікі Аб’яднанага пераходнага кабінету сустрэліся з віцэ-прэзідэнткай YouTube у сувязях з урадамі і публічнай палітыцы Лэслі Мілер, а таксама віцэ-прэзідэнткаю «Google» у сувязях з урадамі і публічнай палітыцы ў Еўропе Анэтэ Крэбэр-Рыль.

На сустрэчы дэмакратычная лідарка ўзняла актуальныя пытанні, якія дапамогуць развязаць праблему беларускай мовы ў прадуктах «Google» і YouTube:

  • дазволіць манетызацыю кантэнту на беларускай мове ў прадуктах «Google» і YouTube;
  • дазволіць рэкламаваць беларускамоўныя відэаролікі на YouTube;
  • спыніць злоўжыванне рэкламнымі інструментамі з боку расейскіх і лукашэнкаўскіх прапагандыстаў;
  • забяспечыць доступ да сайтаў і каналаў незалежных медыяў, прызнаных рэжымам Лукашэнкі экстрэмісцкімі, праз пошукавыя сістэмы ды іншыя інструменты «Google».

Што адбываецца цяпер

Каб зразумець, ці ёсць цяпер якія-небудзь кантакты паміж беларускімі дэмакратычнымі сіламі і прадстаўнікамі ІТ-гігантаў, ці робіцца сёння штосьці для таго, каб змяніць сітуацыю з беларускаю мовай у папулярных інтэрнэт-сэрвісах, мы паразмаўлялі з Франакам Вячоркам, дарадцам Святланы Ціханоўскай.

Франак адзначыў, што атачэнне абранай прэзідэнткі стала камунікуе як з кампаніяй «Google», гэтак і з прадстаўнікамі іншых арганізацыяў.

Адносна кампаніі «Google» наш суразмоўца адзначыў, што ўсе яе асноўныя сэрвісы перакладзеныя на беларускую мову, таму акрэсліў бы сітуацыю як «не крытычную». Пры гэтым ён паведаміў, што ёсць некаторыя сэрвісы, якія стаяць у плане на лакалізацыю па-беларуску, а ў кампаніі заверылі прадстаўнікоў офісу ў тым, што кожныя 3–6 месяцаў будуць выходзіць нейкія абнаўленні, каб было ўсё больш сэрвісаў «Google» па-беларуску.

Што ж датычыць падтрымання беларускамоўнай рэкламы, то Франак Вячорка падкрэсліў, што праблема з мадэрацыяй кантэнту існуе дасюль: «Робаты не навучаныя правяраць рэкламу, калі там ёсць беларускамоўны кантэнт, і мадэратары вельмі часта не маюць такой магчымасці». Таму калі беларускія кампаніі настройваюць рэкламу, то вельмі часта гэта не праходзіць тэхнічнага правярання. Вячорка адзначыў, што «Google» шукае магчымасці развязаць гэтае пытанне.

Адносна праблемы рэкамендацыі беларускага кантэнту ў пошуку Франак Вячорка падкрэсліў, што яна больш складаная і можа развязвацца з дапамогаю ручной мадэрацыі: шмат якія беларускія сайты працуюць па-расейску, а алгарытмы «Google» не навучаныя распазнаваць, дзе сайт з беларускім кантэнтам, а дзе з кантэнтам расейскіх прапагандыстаў. У гэтым плане каманда Святланы Ціханоўскай дзеліцца з кампаніяй сваймі рэкамендацыямі, каб беларускія медыі мелі прыярытэт або хаця б не траплялі ў забарону «Google».

Што рабіць звычайным беларусам

Франак Вячорка падкрэсліў: каб тэхнічныя кампаніі больш актыўна выкарыстоўвалі беларускую мову, заўсёды важныя любыя публічныя кампаніі. Гэта збор подпісаў, лісты з просьбамі дадаваць беларускамоўны кантэнт, запыты.

«Гэта ніколі не лішняе, бо толькі ўмацоўвае наш аргумент, каб было больш кантэнту па-беларуску. Важна, каб статыстыка сведчыла на нашую карысць, каб у большай колькасці беларусаў быў настроены беларускамоўны інтэрфэйс. Калі беларусы будуць заходзіць на беларускамоўныя сайты, то гэта найлепшы аргумент, каб «Google» больш інвеставаў у беларускую мову. Многае ў руках самых карыстальнікаў. Беларусам трэба проста прывучыць сябе свядома выбіраць беларускамоўны кантэнт, пісаць каментары на беларускай мове, ствараць больш кантэнту на беларускай мове, тады ён будзе вышэй цаніцца сэрвісам «Google», – адзначыў наш суразмоўца.

Пры гэтым Франак Вячорка адзначыў: у Офісе Святланы Ціханоўскай створаны спецыяльны аддзел для супрацы з тэхнічнымі кампаніямі, каб прымаць запыты ад беларусаў, беларускіх арганізацыяў, медыяў, НДА. Каб расказаць пра сваю канкрэтную праблему, можна пісаць на адрас tech@tsikhanouskaya.org: напрыклад, можна звяртацца, калі трэба адблакаваць нейкі рэсурс або, наадварот, заблакаваць прапагандысцкі відэаролік, а таксама са шмат якімі іншымі пытаннямі.

Раман Шавель belsat.eu

Стужка навінаў