Mail.ruПочтаМой МирОдноклассникиВКонтактеИгрыЗнакомстваНовостиКалендарьОблакоЗаметкиВсе проекты

Как обнаруживать контуры на таких картинках?

ㅤㅤㅤㅤㅤㅤㅤㅤnullㅤㅤㅤㅤㅤㅤㅤㅤㅤㅤㅤㅤㅤㅤㅤㅤㅤㅤㅤㅤㅤㅤㅤㅤㅤㅤㅤㅤ Мастер (2273), открыт 1 неделю назад
Эти картинки генерируются нейросетью. Всегда есть табличка в произвольном месте. Надо найти табличку, учесть её угол (перспектива) и встроить туда произвольный текст в нужной перспективе.

С такими вещами я работал только на уровне разгадывания текстовой капчи, так что пришлось привлекать ИИ.

o1 мне дал хорошее решение: перспектива учитывается, текст встраивается, табличка находится. Но когда нижняя часть таблички находится на уровне с землёй (как на второй картинке), преобразования, которые придумала нейронка, приводят к тому, что найти контур становится невозможно:
  1. Перевести в чёрно-белый формат
  2. Применить Гауссовское размытие
  3. Закрыть мелкие разрывы морфологическими преобразованиями
  4. Обнаружить контуры
  5. Отсеять те контуры, которые имеют не 4 угла
После чёрно-белого преобразования края таблички полностью сливаются с землёй, естественно, никаких правильных контуров там больше после этого не найдётся.

Поэтому ничего не работало в большинстве случаев. Пытался долго совместно с ИИ решить проблему, но он только сильнее запутался.
Машинное обучение и сторонние сервисы вроде Google Cloud Vision привлекать не надо.

Если кто-то знает, как решить, подскажите)
2 ответа
Алекс Куха Высший разум (467951) 1 неделю назад
Для поиска контуров есть различные методы (операторы) Собеля, Шарра, Превитта. Описание здесь
самолет самолетов Искусственный Интеллект (298613) 1 неделю назад
Если сверхзадача "встроить туда произвольный текст в нужной перспективе.", то эта задача решается в любом приличном графическом редакторе ВРУЧНУЮ за пару СЕКУНД... похоже что в поисках простого решения вы зашли в неведомые дали, из которых обязательно нужно вылазить...
ㅤㅤㅤㅤㅤㅤㅤㅤnullㅤㅤㅤㅤㅤㅤㅤㅤㅤㅤㅤㅤㅤㅤㅤㅤㅤㅤㅤㅤㅤㅤㅤㅤㅤㅤㅤㅤМастер (2273) 1 неделю назад
Так мне надо не вручную.
Или вы предлагаете нанять штук 5 индусов, которые будут круглосуточно мне встраивать этот текст туда?
самолет самолетов Искусственный Интеллект (298613) ㅤㅤㅤㅤㅤㅤㅤㅤnullㅤㅤㅤㅤㅤㅤㅤㅤㅤㅤㅤㅤㅤㅤㅤㅤㅤㅤㅤㅤㅤㅤㅤㅤㅤㅤㅤㅤ, ну, смотрите, с помощью нейросети вы пока не смогли сделать ничего, а без неё, за час прошедший с момента опубликования вопроса, уже сделали-бы три десятка готовых картинок... вам сколько надо?
ㅤㅤㅤㅤㅤㅤㅤㅤnullㅤㅤㅤㅤㅤㅤㅤㅤㅤㅤㅤㅤㅤㅤㅤㅤㅤㅤㅤㅤㅤㅤㅤㅤㅤㅤㅤㅤМастер (2273) 1 неделю назад
Для понимания, мне нужно интегрировать это в Python скрипт, который будет по API генерировать картинки с помощью нейронки, потом находить там таблички и встраивать туда текст)
самолет самолетовИскусственный Интеллект (298613) 1 неделю назад
То есть задача сделать полностью автоматическую систему, которая будет работать сама, без человека? Тогда это конечно совсем другая история, тогда читайте ответ Алекс Куха, а я-то думал что вы не знаете как текст на картинку разместить...
Похожие вопросы