Программа Малыш

01 окт 2012 23:33
max
Опытный писатель
Опытный писатель
Сообщений: 446
Больше
Автор темы
Программа Малыш #22399
Уважаемые форумчане.

Очень интересует ваше мнение.
ПИшу программу для тестирования алгоритма сравнения образов.
Комп+вэбкамера+микрофон
У программы будет 2 режима: Обучение и Распознавание.
В режиме обучения можно подносить любые предметы в поле видимости камеры на фокусное расстояние и голосом озвучивать наименования предметов.
В режиме распознавания также подносим предметы, прога ищет самые похожие из уже изученных, и сама произносит ближайшую голосовую метку для этого предмета из памяти. Т.е. просто говорит - что это за предмет.

Вопрос:
1) Встречали ли хотя бы подобные программы?
2) Что вы думаете об идее в целом.
3) если прога будет работоспособной, как можно ее использовать?
4) может какие есть советы...?

Заранее спасибо.

Пожалуйста Войти или Регистрация, чтобы присоединиться к беседе.

02 окт 2012 03:11
NO.
Академик
Академик
Сообщений: 2213
Больше
Программа Малыш #22400
1. Не встречал.
2. Писать программы хорошо.
3. Слепые её с руками оторвут.
4. Для проверки можно в обратную сторону рисовать образы и говорить слова. Если будет хорошо видеть статику можно переходить на процессы. Или наоборот узнавание процессов может помогать опознавать объекты.

Пожалуйста Войти или Регистрация, чтобы присоединиться к беседе.

02 окт 2012 05:54
max
Опытный писатель
Опытный писатель
Сообщений: 446
Больше
Автор темы
Программа Малыш #22403

4. Для проверки можно в обратную сторону рисовать образы и говорить слова.

вы имеете в виду что прога будет уже распознавать слова и предъявлять образы? или что то другое?

Если будет хорошо видеть статику можно переходить на процессы.

про процессы как не задумывался.. вымысле определенная последовательность распознанных образов может о чем то говорить..
о какой то ситуации

Пожалуйста Войти или Регистрация, чтобы присоединиться к беседе.

02 окт 2012 06:40
Prosolver
Читатель
Читатель
Сообщений: 11
Больше
Программа Малыш #22404
1. Нет.
2.1. Разделять процесс на 2 режима - ложный путь. ЕИ так не делает.
2.2. Надо определиться, что конкретно Вы хотите сделать "сравнение образов" или "именование образов".
3. Ну как, продать конечно! А деньги - пропить. А если серьёзно, то просто выложите прогу в инет бесплатно.
4. Воспользуйтесь готовыми программными решениями тут .

Пожалуйста Войти или Регистрация, чтобы присоединиться к беседе.

02 окт 2012 06:49
NO.
Академик
Академик
Сообщений: 2213
Больше
Программа Малыш #22405

max пишет:

4. Для проверки можно в обратную сторону рисовать образы и говорить слова.

вы имеете в виду что прога будет уже распознавать слова и предъявлять образы? или что то другое?

рисовать и говорить

Пожалуйста Войти или Регистрация, чтобы присоединиться к беседе.

02 окт 2012 07:04
max
Опытный писатель
Опытный писатель
Сообщений: 446
Больше
Автор темы
Программа Малыш #22406

2.1. Разделять процесс на 2 режима - ложный путь. ЕИ так не делает.

1. цель не сделать ИИ. вопрос о конкретной проге..
2. как делает еи тоже можно поспорить ))

2.2. Надо определиться, что конкретно Вы хотите сделать "сравнение образов" или "именование образов".


сравнение.

4. Воспользуйтесь готовыми программными решениями тут.

как то не вяжется с вашим:

1. Нет.

Пожалуйста Войти или Регистрация, чтобы присоединиться к беседе.

02 окт 2012 07:11
max
Опытный писатель
Опытный писатель
Сообщений: 446
Больше
Автор темы
Программа Малыш #22407

4. Воспользуйтесь готовыми программными решениями тут.


за ссылку спасибо. особенно -

Для доступа к группе последовательных пикселей изображения следует избегать операций вычисления эффективного адреса каждого пикселя, заданного координатами x, y. (в двухмерных массивах эта операция производится в неявном виде при обращении к элементу массива). Вместо этого необходимо один раз сформировать переменную-указатель на какой-либо базовый пиксель изображения (обычно на пиксель 0:0), а затем использовать операторы увеличения или уменьшения переменной-указателя.


правда захват я DCPack ом делаю, и изображение бинаризируется..

Пожалуйста Войти или Регистрация, чтобы присоединиться к беседе.

02 окт 2012 19:58 02 окт 2012 19:59 от Inex.
Inex
Модератор
Модератор
Сообщений: 1249
Больше
Программа Малыш #22414

max пишет: 1) Встречали ли хотя бы подобные программы?


Ну, свободно распространяемых программ не встречал, а работ на эту тему много. Впервые такое видел у AIBO на одной из выставок почти 10 лет назад. Там на SIFT'е работало. Правда, без голосового управления, вроде, а образы связывались непосредственно с действиями.

max пишет: 2) Что вы думаете об идее в целом.

А в чем идея?
Это очень частный случай проблемы семантического обоснования лингвистических единиц. Опять же, давно я на этот счет усиленно рекомендовал работы Дэба Роя. С тех пор аналогичных появилось весьма много. Направление это важное и правильное, но проблема не в самой этой идее, а в том, как конкретно ее воплощать.

max пишет: 3) если прога будет работоспособной, как можно ее использовать?

смотря насколько работоспособной

max пишет: 4) может какие есть советы...?

Ну, можно порекомендовать OpenCV - там и видеозахват, и многие базовые функции по обработке изображений есть. Это если своего аналогичного инструментария не наработал.
Но вообще, чтобы давать советы, надо хотя бы представить, что именно и как планируется делать...

Пожалуйста Войти или Регистрация, чтобы присоединиться к беседе.

02 окт 2012 22:32
max
Опытный писатель
Опытный писатель
Сообщений: 446
Больше
Автор темы
Программа Малыш #22417

смотря насколько работоспособной


ну. например, если удастся добиться высокой точности распознавания предметов.
80% например.
без каких-то ограничений на сами предметы.

Но вообще, чтобы давать советы, надо хотя бы представить, что именно и как планируется делать...

непосредственно алгоритм сравнения я уже представлял (и на этом сайте).
разрешение будет 100*100, так как этого хватит для распознавания компактных предметов, а требования к ресурсам очень велики.
Вообще одной из главных проблем у меня является оптимизация программы в плане потребления ресурсов компа.
Использую компонент дельфи DCPack. Граблю картинку вэбки в битмэп (100*100). - фильтр выделение границ - бинаризация.
сам алгоритм работает с бинаризированными образами.
Очень обрадовало меня существование битового формата для картинок. памяти для базы образов понадобиться в 8 раз меньше, чем планировалось )

ну это вкратце.

Пожалуйста Войти или Регистрация, чтобы присоединиться к беседе.

03 окт 2012 03:25 03 окт 2012 04:01 от vxn.
vxn
Опытный писатель
Опытный писатель
Сообщений: 307
Больше
Программа Малыш #22418

4. ..... Если будет хорошо видеть статику можно переходить на процессы. Или наоборот узнавание процессов может помогать опознавать объекты.

А если удастся сопоставлять процессы с целеполаганием ("помогать"), с отношением к ним со стороны желаемого результата "негатив- позитив" (что есть на самом деле - эмоция) по отношению к системе, то можно говорить и о мышлении. А если из целеполагания системы удастся выделить абсолютную составляющую и увеличить её приоритет в принятии решения (что есть "разумна эмоция"), то можно говорить и об Интеллекте (разумном мышлении).
Перенести в систему эмоциональную базу человека не просто, но вполне осуществимо... холод - плохо, тепло - хорошо.... жёсткий- плохо, мягкий -хорошо и т.п., а так же сочетания... В этом случаи мы получим физиологический мыслительный процесс. а если в эмоциональный комплекс удастся добавить приоритетное отношение к красоте окружающего мира , то процесс приобретет качество духовности. Это по сути модель ЕИ.
ИИ предполагает иную физиологию, с большей разрешающей способностью (и соответственно иную эмоциональную базу), однако приоритетное отношение к красоте окружающего мира (разумная эмоциональность) должно оставаться прежним.
Это тоже вкратце...

Пожалуйста Войти или Регистрация, чтобы присоединиться к беседе.

03 окт 2012 05:52
NO.
Академик
Академик
Сообщений: 2213
Больше
Программа Малыш #22420
мне и натуральных психов хватает

Пожалуйста Войти или Регистрация, чтобы присоединиться к беседе.

03 окт 2012 08:54
Inex
Модератор
Модератор
Сообщений: 1249
Больше
Программа Малыш #22424

max пишет: фильтр выделение границ - бинаризация

просто интересно, как на этой основе планируется достичь инвариантное распознавание произвольных объектов...

Пожалуйста Войти или Регистрация, чтобы присоединиться к беседе.

03 окт 2012 09:06 03 окт 2012 09:11 от vchc.
vchc
Модератор
Модератор
Сообщений: 333
Больше
Программа Малыш #22425

max пишет:

смотря насколько работоспособной


ну. например, если удастся добиться высокой точности распознавания предметов.
80% например.
без каких-то ограничений на сами предметы.


К сожалению такого результата вы не достигнете. Зрительный анализатор человека затрагивает больше половины мозга и требует соответствующих вычислительных ресурсов.
Поэтому промышленные системы распознавания могут себе позволить только большие корпорации. Сразу приходит на ум система Google Goggles.
При наличии ресурсов одного компьютера вы можете реализовать лишь распознавание малого конечного количества объектов баз существенной инвариантности их представления.
Системы распознавания текста/пиктограмм хороший пример таких решений.

Ну и как сказал Inex, контурный анализ слаб к инвариантности. Чтобы он хорошо работал, объекты надо всегда представлять под одним углом/освещением, что не соответствует начальным условиям вашей идеи.

Пожалуйста Войти или Регистрация, чтобы присоединиться к беседе.

03 окт 2012 09:22 03 окт 2012 09:38 от Lmm.
Lmm
Старожил
Старожил
Сообщений: 1326
Больше
Программа Малыш #22427
Приходил как-то толстый дядька из супермаркета, охранник ихний главный. Говорит – воруют. Причем воруют все. Меня такое заявление удивило и, даже, задело, я часто хожу в супермаркет и ещё ничего не украл, значит утверждение заведомо ложное. Не, он говорит, все, в смысле - все категории работников. Вот, говорит, кассирша, она знает, что за её руками камера следит чтобы она товар мимо сканера штрихкодового не проносила, и все равно ведь ворует. Надо говорит, чтобы, когда она штрихкодом пикает, камера как то там товар ещё сбоку по внешнему виду добавочно распознавала. Дело в том, что человек в сговоре с кассиршей наклеивает другой штрихкод на товар и дешёвку какую-нибудь пикает. Пусть говорит охранник, автоматическая система работает плохо, не надёжно, через два раза на третий, но и то было-бы очень хорошо.
Вопрос я задал такой - камера цветная? Не, говорит, чёрно-белая.
Я посоветовал над кассой повесить цветную и чтобы не очень широкоугольную, записать один день жизни одной кассы и с записью возвращаться. Мужик не вернулся (хотя про деньги разговор даже не заходил). А ведь у меня уже столько классных идей было! Но все они как-то вокруг выделения цвета и грубо-инвариантного описания взаиморасположения цветовых областей плясали!

Пожалуйста Войти или Регистрация, чтобы присоединиться к беседе.

03 окт 2012 09:23
YNK
Модератор
Модератор
Сообщений: 3538
Больше
Программа Малыш #22428
В общем далеко не ново, и уже существующие тифлоприборы трансформируют свет и цвет в слуховые или тактильные (осязательные) раздражители. Есть специальный ресурс для незрячих и слабовидящих - www.tiflocomp.ru

Пожалуйста Войти или Регистрация, чтобы присоединиться к беседе.

03 окт 2012 09:48 03 окт 2012 09:49 от Lmm.
Lmm
Старожил
Старожил
Сообщений: 1326
Больше
Программа Малыш #22429

YNK пишет: В общем далеко не ново, ..........................

А в этой области уже давно всё не ново.
И не надо чтобы ново!
Надо чтобы работало!
Основная проблема отрасли, что разработчик думает, что его гениальное творение работоспособно и для дела очень полезно, а заказчик, однако, плюётся.

Пожалуйста Войти или Регистрация, чтобы присоединиться к беседе.

03 окт 2012 10:09
YNK
Модератор
Модератор
Сообщений: 3538
Больше
Программа Малыш #22430

Lmm пишет: Надо чтобы работало!

- честно говоря был приятно поражен возможностью общения с слепоглухонемым посредством электронного брайль-планшета, ну вроде бы что такого, чтобы набор с обычной клавиатуры выводился на специфический монитор и в тоже время набор со специфической клавы выводился на монитор обычного ридера, ну чему тут удивляться, ведь все предсказуемо же?! И все таки удивительно, что такая связь да и работает! После общения пришел к выводу, что есть область потребностей из которой, как такового заказа на разработку не поступает, разработчик таки вынужден иногда играть роль заказчика, и нужно для этого погрузиться в тему заказа.

Пожалуйста Войти или Регистрация, чтобы присоединиться к беседе.

03 окт 2012 10:16
Lex
Модератор
Модератор
Сообщений: 4048
Больше
Программа Малыш #22431

vchc пишет: Поэтому промышленные системы распознавания могут себе позволить только большие корпорации.

А вы вообще выдели как мухи или осы летают? )))) И все путем у них и с распознаванием и с позиционированием и с навигацией. Вот только моцг ))) размером не вышел )))

При наличии ресурсов одного компьютера вы можете реализовать лишь распознавание малого конечного количества объектов баз существенной инвариантности их представления.

о еще почему? Что за вздор?

max пишет: ну. например, если удастся добиться высокой точности распознавания предметов.
80% например.

80% это никуда не годиться. Даже 99.9% мало!

разрешение будет 100*100,

Это даже не смешно.

Пожалуйста Войти или Регистрация, чтобы присоединиться к беседе.

03 окт 2012 10:27
Lex
Модератор
Модератор
Сообщений: 4048
Больше
Программа Малыш #22432

Lmm пишет: Приходил как-то толстый дядька из супермаркета, охранник ихний главный. Говорит – воруют. Причем воруют все. Меня такое заявление удивило и, даже, задело, я часто хожу в супермаркет и ещё ничего не украл, значит утверждение заведомо ложное. Не, он говорит, все, в смысле - все категории работников. Вот, говорит, кассирша, она знает, что за её руками камера следит чтобы она товар мимо сканера штрихкодового не проносила, и все равно ведь ворует. Надо говорит, чтобы, когда она штрихкодом пикает, камера как то там товар ещё сбоку по внешнему виду добавочно распознавала. Дело в том, что человек в сговоре с кассиршей наклеивает другой штрихкод на товар и дешёвку какую-нибудь пикает. Пусть говорит охранник, автоматическая система работает плохо, не надёжно, через два раза на третий, но и то было-бы очень хорошо.
Вопрос я задал такой - камера цветная? Не, говорит, чёрно-белая.
Я посоветовал над кассой повесить цветную и чтобы не очень широкоугольную, записать один день жизни одной кассы и с записью возвращаться. Мужик не вернулся (хотя про деньги разговор даже не заходил). А ведь у меня уже столько классных идей было! Но все они как-то вокруг выделения цвета и грубо-инвариантного описания взаиморасположения цветовых областей плясали!

Во! Я сам сейчас эту тему окучиваю!!! Только немного с другой стороны!! Ваш мужик кстати очень ценный. Он с пониманием проблемы. Тут не паханный рынок и нужно срочно на него выходить. У вас с этим мужиком контакт сохранился? В целом такую систему можно быстро собрать.

Пожалуйста Войти или Регистрация, чтобы присоединиться к беседе.

03 окт 2012 11:23
Inex
Модератор
Модератор
Сообщений: 1249
Больше
Программа Малыш #22434
Приходили к нам как-то ребята, которым поручили ставить систему безопасности на вывоз легированных добавок. Их там грузовиками и даже целыми составами воруют. Вроде, задача была не слишком сложная, и работа наша стоила бы намного меньше одного сворованного кузова добавок. Однако работа не пошла по вполне понятным причинам... А Вы говорите, магазины...

Пожалуйста Войти или Регистрация, чтобы присоединиться к беседе.

03 окт 2012 11:26
Inex
Модератор
Модератор
Сообщений: 1249
Больше
Программа Малыш #22435

vchc пишет: Сразу приходит на ум система Google Goggles.

не стоит преувеличивать ее возможности; работает она на тех же принципах, что и "маленькие" системы распознавания; хотя кое что для масштабируемости там, вероятно, добавлено оригинального

Пожалуйста Войти или Регистрация, чтобы присоединиться к беседе.

03 окт 2012 11:28
Inex
Модератор
Модератор
Сообщений: 1249
Больше
Программа Малыш #22436

Lex пишет: А вы вообще выдели как мухи или осы летают? )))) И все путем у них и с распознаванием и с позиционированием и с навигацией. Вот только моцг ))) размером не вышел )))

ну, у тех же мух с распознаванием плохо; объекты друг от друга они не отличают и используют достаточно простые признаки
скажем, если на некоторой поверхности нарисовать набор жирных черных точек, то чем больше будет точек, тем с большей вероятностью муха туда будет садиться; то есть черное пятно от мухи-собрата она отличить не может...

Пожалуйста Войти или Регистрация, чтобы присоединиться к беседе.

03 окт 2012 11:39 03 окт 2012 12:18 от max.
max
Опытный писатель
Опытный писатель
Сообщений: 446
Больше
Автор темы
Программа Малыш #22437

просто интересно, как на этой основе планируется достичь инвариантное распознавание произвольных объектов...

При наличии ресурсов одного компьютера вы можете реализовать лишь распознавание малого конечного количества объектов баз существенной инвариантности их представления.


просто саму программу делаю в рамках более широкого проекта, то бишь уже моделирования разумного поведения.
своеобразная проверка алгоритма.

так вот скажу я вам в жизни и опыте (БД) любого разумного объекта.... образов - десятки и сотни тысяч , а общая база - миллиарды. так что инвариантность набирается за счет базы. для статичного представления(проверки когда фиксируем объект перед вэбкой) подойдет и небольшая база.
!

Пожалуйста Войти или Регистрация, чтобы присоединиться к беседе.

03 окт 2012 11:47
max
Опытный писатель
Опытный писатель
Сообщений: 446
Больше
Автор темы
Программа Малыш #22438

Поэтому промышленные системы распознавания могут себе позволить только большие корпорации.


А вы вообще выдели как мухи или осы летают? )))) И все путем у них и с распознаванием и с позиционированием и с навигацией. Вот только моцг ))) размером не вышел )))


!

Пожалуйста Войти или Регистрация, чтобы присоединиться к беседе.

03 окт 2012 11:53 03 окт 2012 12:27 от max.
max
Опытный писатель
Опытный писатель
Сообщений: 446
Больше
Автор темы
Программа Малыш #22439

max написал:
ну. например, если удастся добиться высокой точности распознавания предметов.
80% например.


80% это никуда не годиться. Даже 99.9% мало!


это хотя бы..

просто это больше, чем могут современные системы.. ( хотя есть проги и на андроиде которые друзей по фоткам ищут.. но наверное надо проверить лично ))

а фактически, например у человека нет 99% распознавания.. в обычной жизни вы: 1) не заморачиваетеь 2) есть редкие ошибки по разным причинам.

и фактически для жизни .. и вообще постоянно процент может 96-97..

этого хватит я имею ввиду для эффективного поведения

Пожалуйста Войти или Регистрация, чтобы присоединиться к беседе.

03 окт 2012 11:58
max
Опытный писатель
Опытный писатель
Сообщений: 446
Больше
Автор темы
Программа Малыш #22440

разрешение будет 100*100,

Это даже не смешно.


есть сервак большой?, сделаем 500*500 ))) ;)

Пожалуйста Войти или Регистрация, чтобы присоединиться к беседе.

03 окт 2012 12:02
Inex
Модератор
Модератор
Сообщений: 1249
Больше
Программа Малыш #22441

max пишет: так вот скажу я вам в жизни и опыте (БД) любого разумного объекта образов - десятки и сотни тысяч , а общая база - миллиарды. так что инвариантность набирается за счет базы. для статичного представления(проверки когда фиксируем объект перед вэбкой) подойдет и небольшая база.
!

ну-ну
желаю удачи; будет интересно посмотреть, если что-то получится

Пожалуйста Войти или Регистрация, чтобы присоединиться к беседе.

03 окт 2012 12:11 03 окт 2012 12:13 от Lex.
Lex
Модератор
Модератор
Сообщений: 4048
Больше
Программа Малыш #22443

Inex пишет:

Lex пишет: А вы вообще выдели как мухи или осы летают? )))) И все путем у них и с распознаванием и с позиционированием и с навигацией. Вот только моцг ))) размером не вышел )))

ну, у тех же мух с распознаванием плохо; объекты друг от друга они не отличают и используют достаточно простые признаки
скажем, если на некоторой поверхности нарисовать набор жирных черных точек, то чем больше будет точек, тем с большей вероятностью муха туда будет садиться; то есть черное пятно от мухи-собрата она отличить не может...

Ну ладно )) Тогда пускаем в бой кавалерию ))) Пчёлок ))) У тех зашибись с распознаванием, а нейронов не шипко больше ))

Inex пишет: Приходили к нам как-то ребята, которым поручили ставить систему безопасности на вывоз легированных добавок. Их там грузовиками и даже целыми составами воруют. Вроде, задача была не слишком сложная, и работа наша стоила бы намного меньше одного сворованного кузова добавок. Однако работа не пошла по вполне понятным причинам... А Вы говорите, магазины...

Норм. Потому и важен заказчик с "пониманием". Зверь этот редкий, но он есть.

max пишет: есть сервак большой?, сделаем 500*500 ))) ;)

Дело тут не в серваке, который на сегодня ничего не стоит, а в вашей постановке. Она к сожалению трагична.

а фактически, например у человека нет 99% распознавания

Ага. Возьмите любой видерегистратор с авто и сделайте раскадровку за час езды по пробкам. И поделите на число столкновений с другими авто )))

60*60*24 = 86400 ))

У пчелок раскадровка вообще жуткая будет.

Пожалуйста Войти или Регистрация, чтобы присоединиться к беседе.

03 окт 2012 12:19
Lex
Модератор
Модератор
Сообщений: 4048
Больше
Программа Малыш #22444

max пишет: это хотя бы..

просто это больше, чем могут современные системы.. ( хотя как тут уже привели пример, есть проги и на андроиде которые друзей по фоткам ищут.. но наверное надо проверить лично ))

а фактически, например у человека нет 99% распознавания.. в обычной жизни вы: 1) не заморачиваетеь 2) есть редкие ошибки по разным причинам.

и фактически для жизни .. и вообще постоянно процент может 96-97..

этого хватит я имею ввиду для эффективного поведения

Не хватит. Нужно 99.999999%. У меня есть задача мечты, ради решения которой все в свое время и начиналось. Там точно мало 99%, что уже достигалось не раз разными методами.

Пожалуйста Войти или Регистрация, чтобы присоединиться к беседе.

03 окт 2012 12:22
Inex
Модератор
Модератор
Сообщений: 1249
Больше
Программа Малыш #22445

Lex пишет: Ну ладно )) Тогда пускаем в бой кавалерию ))) Пчёлок ))) У тех зашибись с распознаванием, а нейронов не шипко больше ))

с пчелками, конечно, сложнее, но способность к распознаванию у них тоже весьма предметно-специфична
эффективность распознавания там, конечно, впечатляет, но все же нельзя сравнивать с обучением распознаванию произвольных объектов...

Lex пишет: Норм. Потому и важен заказчик с "пониманием". Зверь этот редкий, но он есть.

Тут дело именно в том, что это реально не было никому нужно (в то время как были конкретные люди, которым это было совсем не нужно - те, кто на отсутствии системы безопасности делали огромные деньги)...

Пожалуйста Войти или Регистрация, чтобы присоединиться к беседе.

Модераторы: InexSVGYNK
Время создания страницы: 0.533 секунд
Работает на Kunena форум