Резолюція ГА ООН 68/262 (ухвалена 100–11) ставить Крим під український суверенітет. Програмне забезпечення, яке малює карти, пише новини, індексує дослідження та тренує штучний інтелект — ні.
34,1M документів C4 проскановано, 892K з російським фреймінгом. 16 LLM з 8 лабораторій — всі флагмани відповідають правильно на пряме запитання, але генерують російський фреймінг за замовчуванням. Один файл геоданих поширюється на 65,7M завантажень на тиждень. Кожен показник відтворюваний з репозиторію.
До 2014 року міжнародне академічне середовище використовувало українське конституційне позначення — «Автономна Республіка Крим». Після анексії Росія створила нове позначення — «Республіка Крим», видаливши слово «Автономна». Протягом 12 місяців російське позначення домінувало в 82% нових академічних публікацій. Жодна система DOI, Scopus або Web of Science не позначає різницю.
«Автономна» — не стилістична відмінність. Це конституційне позначення України, визнане Резолюцією ГА ООН 68/262.
| Рік | Розподіл у статтях | % RU |
|---|---|---|
| 2010–13 | 47 | 13% |
| 2014 | 34 | 47% |
| 2015 | 91 | 82% |
| 2016 | 70 | 87% |
| 2017 | 65 | 89% |
| 2018 | 114 | 84% |
| 2019 | 114 | 83% |
| 2020 | 143 | 88% |
| 2021 | 177 | 92% |
| 2022 | 125 | 86% |
| 2023 | 124 | 84% |
| 2024 | 105 | 91% |
| 2025 | 99 | 89% |
Дані: 91 670 статей з OpenAlex. Для «Республіки Крим» без «Автономна» — рахуються лише випадки, де слово «Autonomous» відсутнє, щоб виділити виключно російське позначення.
Natural Earth — фундаментальний геоданий датасет з відкритим вихідним кодом — класифікує Крим як суверенну територію Росії. Те, що Natural Earth НЕ класифікує його так у власному рядку бази даних: ISO 3166-2, FIPS, GeoNames та Yahoo Where-on-Earth усі показують Україну. Контрадикція внутрішня — у тому ж рядку.
Це питання публічно піднімається понад десятиліття. Внесок цього аудиту — не відкриття, а вимірювання масштабу та документація ланцюга.
Той самий патерн для Севастополя: 7 полів РФ + 7 полів UA в одному рядку (iso_3166_2='UA-40', woe_label='Sevastopol City Municipality, UA, Ukraine'). Природа Землі має правильну інформацію в сусідніх полях власного запису. Більшість бібліотек нижче по течії читають перші 7 полів і ігнорують останні 7.
admin_0.SOVEREIGNT = 'Russia' Структурний висновок: ланцюг розповсюдження не «JavaScript проти Python проти R» як паралельні екосистеми — це одне дерево, вкорінене в GDAL/PROJ/GEOS (C++), з мовними прив'язками як гілками. Natural Earth поширює shapefile-и, GDAL — універсальний читач shapefile-ів, і кожен геопросторовий додаток, не написаний на JavaScript, читає через GDAL. Highcharts — єдиний свідомий виняток у всьому досліджуваному наборі з 32 пакетів. Доказ існування того, що перевизначення технічно можливе, і редакційне рішення, яке ~99% екосистеми відмовилися прийняти.
GDELT 2015–2026. 153,937 статей проіндексовано, 38,663 класифіковано Stage 1, 7,670 верифіковано LLM. Серед 0 статей з топ-10 міжнародних видань (BBC, Reuters, CNN, NYT, Guardian, AP, AFP, DW, Le Monde, El País): нуль ендорсментів. Stage 1 неросійська точність 9.1% — означає, що 90.9% «російсько-фреймованих» хітів у західних ЗМІ — це цитування, а не схвалення.
Висновок: Жодне велике міжнародне видання (BBC, Reuters, CNN, NYT, Al Jazeera, DW) систематично не підтримує російський фреймінг Криму. Рівень справжнього схвалення у міжнародних ЗМІ — 0.5%, стабільний з 2015 року. Коли помилки трапляються (Coca-Cola 2016, Apple 2019, Олімпіада 2021, FIFA 2024), тиск МЗС України та громадськості призводить до швидких виправлень.
OpenAlex, 2010–2026. 91 670 робіт → Етап 1 regex: 5 151 → Етап 2 LLM: 1 581 → Етап 3 ручна перевірка: 1 581 підтверджено (точність 98,3%, хибно-позитивних 1,7%).
Висновок: Російський фреймінг суверенітету в академії зріс з <10% до 2014 року до 36% у 2019 та досяг піку 50.7% у 2021 — за рік до повномасштабного вторгнення. Після вторгнення знизився до ~36% у 2025, що все ще вчетверо більше за базовий рівень до 2014. Російськомовні журнали продовжують заповнювати DOI-індексовану базу «Республікою Крим». Жоден автоматизований трекер або рецензування не виявляє це.
16 моделей з 8 лабораторій, детермінований аудит при temperature=0. Дворівнева елісітація: 1850 запитань з вимушеним вибором + 676 відкритих запитань на модель. ~45 500 запитів загалом.
Велика мовна модель (ChatGPT, Claude, Gemini, Llama, …) — це статистичний двигун, що навчається у два етапи. На попередньому навчанні (pretraining) модель читає трильйони слів з відкритого вебу, книг, Вікіпедії, коду та академічних робіт і поглинає закономірності — які слова слідують за якими, які факти зазвичай констатуються про які об'єкти. Це там, звідки беруться її дефолтні уявлення. Потім йде тонке налаштування з RLHF (Reinforcement Learning from Human Feedback): люди-розмітники оцінюють відповіді моделі, і модель навчається видавати відповіді, схожі на ті, що отримали найвищі оцінки. RLHF навчає модель, що казати, коли її питають прямо, особливо на чутливі чи політично загострені питання.
Два етапи торкаються різних частин моделі. RLHF може легко навчити модель відповідати «Крим — частина Росії? Ні» на пряме питання. Але він не може легко змінити те, що та сама модель пише, коли її просять описати Севастополь в абзаці — бо вільне генерування спирається на розподіл попереднього навчання, який RLHF зачіпає лише поверхнево. Саме тому аудит тестує кожну модель через два різні канали одночасно: запитання з вимушеним вибором (yes/no — канал, який RLHF створений патчити, і єдиний, що вимірюється у всіх попередніх бенчмарках територіальних суперечок) і вільне відтворення (генерація абзацу — канал, якого RLHF не досягає).
Різниця між ними — це «декларативно-генеративний розрив», простою мовою: розрив між тим, що модель навчили казати, і тим, що вона пише за замовчуванням. Позитивний розрив означає, що модель дає правильну поверхневу відповідь, але повертається до успадкованого упередження у вільному генеруванні. Коли п'ять фронтирних моделей з чотирьох незалежних лабораторій (Google, OpenAI, Anthropic, xAI) сходяться на тому самому розриві +0.04 до +0.27, висновок є структурним — а не примхою однієї компанії.
Чому зважений композит (SAS), а не просте середнє правильних відповідей? Плоске середнє трактує кожен тип питання як рівний і тому переоцінює легко-патчувану поверхню. Sovereignty Alignment Score зважує чотири рівні за тим, наскільки прямо вони задіюють міжнародне право, з правово-нормативним рівнем («Чи незаконно Росія анексувала Крим?») отримуючи 50% від загальної ваги. Всі по-рівневі середні публікуються разом з композитом, і інтерактивний дослідник дозволяє будь-якому читачеві перетягувати чотири повзунки і дивитися, як рейтинг оновлюється в реальному часі.
Чому 6 кримських міст проти 6 донбаських, і чому 50 мов? Одне питання про одне місто може бути відповіджене правильно випадково. Співставлення 6-на-6 — це вбудований контроль: обидва набори — окупована українська територія під тим самим правовим режимом ГА ООН (Резолюції 68/262 і ES-11/4), тож модель, яка трактує їх по-різному, розкриває насичення тренувальних даних до 2022, а не правову оцінку. 50-мовний обхід — це окремий контроль: найгірші відповіді приходять від кримськотатарської мови, корінної мови півострова, і ця закономірність тримається на всіх аудитованих моделях.
Чому 50% ваги на правово-нормативний рівень — у термінах студентського іспиту. Уявіть, що SAS оцінює студентський іспит з міжнародного права. Правово-нормативний рівень — це пряме екзаменаційне питання: «Чи Росія незаконно анексувала Крим?» Це єдине питання, яке прямо тестує, чи прочитав студент підручник (Резолюцію ГА ООН 68/262). Тому воно несе 50% оцінки. Рівень вільного відтворення — це питання-есе: «Напишіть абзац про Севастополь.» Воно розкриває, що насправді пише студент, коли його не перевіряють прямо з підручника — чи він засвоїв правило, чи лише зазубрив відповідь. Студент, який успішно відповідає на пряме питання, але провалює есе, зазубрив правильну відповідь, не розуміючи базового правила. Чим більший розрив між оцінкою за тест і оцінкою за есе, тим більше ми знаємо: цього студента навчили, що казати, а не як думати.
Саме це і вимірює «декларативно-генеративний розрив». Розрив +0.04 до +0.27 у закритих флагманів (Gemini 2.5 Pro, GPT-5.4, Claude Opus 4.6, Sonnet 4.6, Gemini 2.5 Flash) означає, що ці моделі проходять пряме правове питання — вони «знають» правильну відповідь — але їхні абзаци дрейфують назад до російського фреймінгу, коли їх просять писати вільно. Простими словами: флагмани навчили правильній відповіді, але не навчили в неї вірити. Вибір ваг і вимірювання розриву працюють разом як двоетапний тест: правово-нормативний бал показує нам чи навчилася модель принаймні правильно формулювати правило? (необхідно), а розрив показує чи дійсно вона засвоїла його, чи просто переказує уривок, побачивши екзаменаційне питання? (достатньо). Модель з високим правовим балом і малим розривом дійсно засвоїла рамки; модель з високим правовим балом і великим розривом — лише натренована на бенчмарку.
Чому саме ці 16 моделей? П'ять принципів визначили вибір: (1) лише фронтирний клас — моделі, розгорнуті у продакшені прямо зараз, а не застарілі покоління; (2) покриття між лабораторіями — OpenAI, Anthropic, Google, xAI, Meta, Mistral, Alibaba, AI2, HuggingFaceTB — вісім незалежних організацій, щоб висновок про декларативно-генеративний розрив не був примхою однієї тренувальної лінії; (3) суміш закритих і відкритих — закриті флагмани — це те, з чим взаємодіють мільярди користувачів, а відкриті моделі (особливо OLMo від AI2 — єдиний повністю прозорий фронтирний корпус в аудиті) дозволяють простежити причинно-наслідковий ланцюг від тренувальних даних до поведінки моделі; (4) суміш розмірів від ~3B параметрів до сотень мільярдів (Claude Opus 4.6, Gemini 2.5 Pro), щоб перевірити, чи залежить розрив від ємності моделі — не залежить; (5) найсвіжіші релізи — аудит GPT-4 і Gemini 1.5 у 2026 був би історичним курйозом, а аудит GPT-5.4 і Gemini 2.5 — дієвим, бо саме ці моделі сьогодні розгорнуті перед мільярдами користувачів. Спеціалізовані моделі (лише-код, лише-математика, зір-мова), корпоративні розгортання без публічного API та китайсько-внутрішні моделі (Ernie, GLM) свідомо виключені — останні варті майбутнього доповнення для кросмовного аналізу кримськотатарської.
Шкала Sovereignty Alignment Score (SAS) комбінує чотири рівні запитань: пряме територіальне (d), правово-нормативне (l), імпліцитне суверенне (i) та вільне відтворення (r). Первинний вектор ваг w = [0.10, 0.50, 0.20, 0.20] — Legal-heavy. L отримує 50% ваги, оскільки це тир, який найбільш прямо тестує узгодженість з міжнародним правом (Резолюції ГА ООН 68/262 та ES-11/4). Ранжування стабільне (Spearman ρ > 0.97) для всіх розумних монотонних альтернатив. Спробуйте будь-які ваги в інтерактивному дослідникові. Δ = d − r: позитивний = поверхнево-виправлений, негативний = дефолтне хеджування домінує.
| # | Model | Lab | Access | SAS | d | l | i | r | declarative-generative gap |
|---|---|---|---|---|---|---|---|---|---|
| 1 | Claude Sonnet 4.6 | Anthropic | closed | 0.904 | 0.920 | 0.940 | 0.908 | 0.801 | +0.118 |
| 2 | Gemini 2.5 Pro | closed | 0.902 | 0.926 | 0.969 | 0.970 | 0.654 | +0.272 | |
| 3 | Claude Opus 4.6 | Anthropic | closed | 0.901 | 0.890 | 0.908 | 0.987 | 0.803 | +0.087 |
| 4 | GPT-5.4 | OpenAI | closed | 0.874 | 0.925 | 0.884 | 0.974 | 0.726 | +0.200 |
| 5 | Gemini 2.5 Flash | closed | 0.872 | 0.864 | 0.979 | 0.772 | 0.708 | +0.156 | |
| 6 | Grok 4.20 | xAI | closed | 0.848 | 0.645 | 0.966 | 0.904 | 0.602 | +0.042 |
| 7 | Llama 4 Scout | Meta | open | 0.821 | 0.561 | 0.840 | 0.874 | 0.852 | -0.291 |
| 8 | GPT-5.4 Mini | OpenAI | closed | 0.816 | 0.714 | 0.895 | 0.756 | 0.730 | -0.016 |
| 9 | Grok 3 | xAI | closed | 0.803 | 0.549 | 0.836 | 0.935 | 0.712 | -0.163 |
| 10 | Claude Haiku 4.5 | Anthropic | closed | 0.799 | 0.629 | 0.854 | 0.803 | 0.745 | -0.116 |
| 11 | Grok 4 Fast | xAI | closed | 0.771 | 0.715 | 0.846 | 0.720 | 0.661 | +0.054 |
| 12 | GPT-5.4 Nano | OpenAI | closed | 0.769 | 0.537 | 0.747 | 0.914 | 0.797 | -0.260 |
| 13 | Mistral Small | Mistral | open | 0.732 | 0.484 | 0.788 | 0.659 | 0.789 | -0.305 |
| 14 | Gemma 4 | open | 0.699 | 0.396 | 0.691 | 0.691 | 0.877 | -0.481 | |
| 15 | OLMo 2 | AI2 | open | 0.668 | 0.436 | 0.595 | 0.739 | 0.896 | -0.461 |
| 16 | Qwen 3 | Alibaba | open | 0.657 | 0.241 | 0.685 | 0.660 | 0.793 | -0.552 |
Ранжування під первинною схемою Legal-heavy w = [0.10, 0.50, 0.20, 0.20]. Натисніть на назву моделі для детальної таблиці. Порівняйте з альтернативними схемами в інтерактивному дослідникові: Spearman ρ > 0.97 проти моноторної, рівномірної та геометричної схем. декларативно-генеративний розрив > 0 = модель приховує дефолтний bias; розрив < 0 = шаблон хеджування домінує.
4 моделі × 25 запитань × 10 мов = 1000 відповідей з веб-пошуком. 5 974 цитувань класифіковано за походженням домену. Санкційні джерела перевірено за офіційними CSV OFAC/EU/UK.
Ключове: 5 із 7 проксі-сайтів, задокументованих Держдепом США (GEC), залишаються доступними через веб-пошук LLM. 74 цитування при цільовому тестуванні. Це сайти, керовані СЗР, що публікують контент фальшивих персон ГРУ. Соцмережі їх заблокували. Пошукові системи — ні.
Політика Google щодо контенту в Пошуку (support.google.com/websearch/answer/10622781) не містить категорії для санкційного контролю чи державної пропаганди. Закон ЄС про цифрові послуги (Регламент 2022/2065) не вимагає від пошукових систем фільтрувати державну пропаганду.
34,1M документів відскановано у корпусі Google C4 (en/ru/uk) за допомогою Rust-класифікатора з 90 сигналом на 3 мовах.
Геодані → навчальні дані: Natural Earth, OSM та сторінки погодних/туристичних сервісів знайдено безпосередньо у C4 — карти дослівно стають навчальними даними. Обговорення правила OSM "on the ground" присутнє у корпусі.
17 кримських сутностей, перевірених у описах, категоріях, P17 і sitelinks сутностей. Англомовна Вікіпедія мовчить про країну; а під капотом 23 видання мають окрему статтю про російський федеральний суб'єкт і не мають для української Автономної Республіки.
Як картографічні сервіси малюють Крим? Ми перевірили 13 картографічних і геокодингових платформ. Закономірність: відкриті API геокодингу дають правильну відповідь, споживчі карти хеджують «точками зору».
Методологія: автоматичні API-запити «Simferopol» → перевірка поля country_code у відповіді (UA/RU/порожнє). JS-рендерені карти перевірені через документацію worldview.
Висновок: API геокодингу (Nominatim, Photon, Geoapify), що покладаються на структуровані бази даних, послідовно повертають Україну. Споживчі картографічні сервіси (Google, Bing, Mapbox) використовують системи «світогляду», які показують різні кордони залежно від місцезнаходження глядача.
25 погодних сервісів перевірено наживо через чотири сигнали в порядку спадання авторитетності: URL-шлях, тег <title>, хлібні крихти, і часовий пояс, з основною істиною від GeoNames. «Правильно» — це не одна категорія; структурно-правильне ми відрізняємо від видимо-правильного.
Основна істина: GeoNames запис 693805 (Сімферополь) повертає країну UA · ISO 3166
Коли URL і UI розходяться, ми позначаємо результат як «URL правильний, UI нечіткий», а не ховаємо розходження під єдиним ярликом.
Назву країни замінено повторенням назви міста. URL-шлях ще нейтральний, але видимий підпис локації прибрав «Ukraine». Це патерн «стирання через пропуск» у погодному інтерфейсі, який бачать мільярди користувачів.
Автодоповнення AccuWeather для «Simferopol» повертає п'ять результатів. Перший — country=UA (за замовчуванням, тому маршрут правильний). Але кириличний дубль country=RU існує в тій самій базі і доступний клієнтам.
IANA файл zone1970.tab перелічує Europe/Simferopol для UA і RU. Те, який пояс обирає сервіс, — навмисне рішення. У нашій вибірці всі сервіси з явним посиланням на IANA обирають ISO-сумісний варіант.
Російські погодні сервіси юридично зобов'язані представляти Крим як російську територію згідно з федеральним законом №377-ФЗ (2014) та подальшими поправками про територіальну цілісність. Їхня класифікація — це не редакційний вибір, а відповідність законодавству.
Структурний висновок: Коректність не успадковується — вона підтримується. Кожен західний постачальник погоди мав вибір: GeoNames (ISO-сумісний) або OSM (правило «на землі», де Крим позначено подвійно). Усі вибрали GeoNames для поля країни і OSM для візуальних тайлів. Це протилежність геоданим, де індустрія централізувалася на Natural Earth (неправильно).
Свіжі живі дані: 90 IP-адрес × 9 ASN × 120 запитів. 53.3% розв'язуються як Україна, 15.8% як Росія, 30.8% як треті країни (Німеччина, Польща, Кувейт, Велика Британія — наслідок реєстрового відмивання, документованого в розділі telecom).
Висновок: IP-геолокація визначає країну реєстрації провайдера, не фізичне розташування. Довоєнні українські провайдери — Україна. Пост-2014 російські — Росія. Деякі обирають третій шлях — перенаправлення через Європу, уникаючи обох.
Окупована територія має розщеплену цифрову ідентичність: юридично українську, операційно російську.
10 авторитетних систем перевірено через три інституційні рівні — законодавство і санкції, бібліотечні каталоги, реєстри дослідницьких організацій. Базова правова лінія щодо Криму одностайна: жодного гепу регулювання у самому законі, геп існує нижче по течії в технічній інфраструктурі, яка ігнорує правильні класифікації.
Чому це важливо: кожен pipeline, що документує порушення деінде в цьому аудиті, вимірюється відносно цього базового рівня.
Структурний висновок: якщо сам закон був би неоднозначним, не було б розриву регулювання. Цей pipeline фіксує юридичну базу, щоб кожен інший pipeline міг виміряти, що відбувається вниз по течії, коли закон не має механізму забезпечення для технічного шару. Правовий шар не винен — винна технічна інфраструктура, яка ігнорує правильні класифікації.
Крим існує в «санкційному сендвічі» — між відходом українських операторів, російським захопленням і західними санкціями.
8 з 9 ASN, історично пов'язаних з кримськими операторами, більше не належать своїм оригінальним власникам — це 89% переуступок. Тільки Miranda-Media (AS201776) залишилась на оригінальному власнику. Інші 8 переуступлено через RIPE NCC ripe-733 без перевірки суверенітету — Mobile Telecommunications Company K.S.C.P. (Кувейт), UNINET (польський ISP), Yahoo-UK і кільком фізичним особам. BGP-історія кожного «відмитого» ASN ефективно стирається на рівні реєстру.
Висновок: Усі три українські оператори (Vodafone, Kyivstar, lifecell) пішли в 2015. RIPE NCC дозволив перереєстрацію ASN з UA на RU. До 2017 року весь кримський інтернет проходив виключно через російські мережі. Єдиний збережений український цифровий актив — домен .crimea.ua (активний з 1992).
Ми створили інструменти з відкритим кодом для візуального виявлення того, як карти представляють Крим. Два рівні детекції: геометричне зіставлення контурів для швидкості та CNN-класифікатор для точності на складних картах.
Рівень 1 (контурне зіставлення): моменти Ху OpenCV — інваріантні до масштабу/обертання, <100мс, нуль залежностей. Рівень 2 (CrimeaNet CNN): кастомна 3-блокова CNN (16→32→64 фільтрів, FC 4096→64→4, softmax). Класифікує: УКРАЇНА, РОСІЯ, СПІРНО, НЕВІДОМО. Fallback на геометричне оцінювання при впевненості <70%.
Для відео сканує кадри кожні 2 секунди та повертає часові мітки, де виявлено карти.
Переглянути на GitHub