Откуда берётся наш каталог: Open Food Facts, Честный ЗНАК, и ваши фото
Четыре источника
Каталог Polezno — не самописная база и не результат партнёрства с одной компанией. Это композиция из четырёх источников, каждый со своими сильными сторонами:
- Open Food Facts — международная открытая база. Покрывает большинство глобальных брендов (Nestlé, Coca-Cola, Danone, Unilever) и значительную часть европейских частных марок. Слабее в локальных KZ и RU брендах.
- «Честный ЗНАК» — государственная система маркировки RU. Через неё мы получаем структурированные данные о продуктах, которые продаются и в KZ через цепочки EAEU (например, многие позиции на полке Magnum и Galmart).
- Сайты ретейлеров — Magnum, Galmart, Small. Мы парсим публично доступные карточки товаров (название, бренд, штрихкод, состав, фото). Покрытие неполное и нерегулярное, но это единственный источник для некоторых private-label SKU.
- Фотографии пользователей — главный источник для длинного хвоста локальных продуктов. Когда вы сканируете штрихкод, которого у нас нет, мы просим фото этикетки. После модерации продукт появляется в каталоге.
Почему так много источников
Ни один из них не покрывает все. Open Food Facts — большой, но KZ-специфика там слабая. «Честный ЗНАК» — структурированный, но не все SKU зарегистрированы. Сайты ретейлеров — точечные. Пользовательские фото — самые свежие, но требуют модерации.
Композиция даёт компромисс: широкое покрытие + актуальность + структурированность. Когда два источника по одному SKU расходятся, мы пишем в карточке: «состав уточняется — пришлите фото актуальной упаковки».
Что мы делаем с пользовательскими фото
Когда вы отправляете фото:
- OCR-распознавание. Текст состава распознаётся автоматически, чтобы редактор не печатал с нуля.
- Ручная модерация. Редактор сравнивает OCR с фото, исправляет ошибки распознавания, проверяет, что состав читаемый, а на фото нет личных данных (рук с кольцами, окружающих ценников с QR-кодами, и так далее).
- Публикация. Через 24–48 часов после отправки SKU появляется в каталоге для всех пользователей. Имя отправителя не указывается; в карточке стоит «Источник: фото пользователя, дата».
Чего мы НЕ делаем с фото
- Не передаём рекламодателям или сторонним брендам.
- Не продаём как датасет.
- Не используем для рекламы продукта (наша работа — оценить состав, а не продвигать SKU).
- Не сохраняем личные данные. Если на фото случайно попали ваше лицо, документ, или адрес магазина — модератор это вырежет или попросит прислать новое фото.
Как помочь каталогу
Самый эффективный способ — сканировать в Магнуме, Галмарте и Small те SKU, которых ещё нет в Polezno, и присылать фото этикеток. Каждое сканирование расширяет каталог на одну позицию для всех. См. также наши страницы про редполитику и методологию оценки.
Частые вопросы
Что такое Open Food Facts?
Open Food Facts — это международная открытая база пищевых продуктов, аналог Википедии для еды. Запущена в 2012 году французской командой; на сегодня в ней более 3 миллионов SKU из 200+ стран. Каталог наполняется добровольцами и брендами; вся информация публикуется под лицензией Open Database License. Это основной источник для международных продуктов, которые продаются и в KZ.
Что такое «Честный ЗНАК» и зачем он нам?
«Честный ЗНАК» — государственная система маркировки товаров в России и через интеграцию — в EAEU. Производители обязаны загружать в неё актуальный состав и атрибуты SKU. Это даёт нам структурированные данные по продуктам, которые продаются в KZ и одновременно зарегистрированы в RU-цепочке.
Почему вы запрашиваете фото моих продуктов?
Каталог не покрывает 100% полок KZ-ретейлеров — особенно локальные бренды и private-label линейки. Когда вы сканируете SKU, которого у нас нет, мы просим фото этикетки, чтобы добавить его в каталог. Через 24–48 часов после модерации этот продукт появляется в Polezno для всех пользователей.
Что вы делаете с моими фото?
Только используем для каталога. Фото проходит ручную модерацию: проверяем читаемость состава, корректируем OCR-распознавание, удаляем личные данные если они случайно попали в кадр. После публикации фото и состав становятся частью открытого каталога Polezno; мы не передаём их рекламодателям и не продаём.
Источники
- Open Food Facts — Open Database License — Open Food Facts, 2023
- Государственная информационная система «Честный ЗНАК» — ЦРПТ (Россия), 2024
Автор: редакция Polezno. Опубликовано 2026-05-13. Это не медицинский совет.