Грязный политикан ([info]bromozel) wrote,
@ 2004-11-05 10:18:00
Previous Entry  Add to memories!  Tell a Friend  Next Entry
Носится в воздухе.
Помню, как в прошлом году я тут в коридоре встретил знакомую, которую не видел больше 10 лет. Мы разговорились, и разговор постепенно перешел на искусственный интеллект, распознавание образов и генетические алгоритмы. После чего она сказала задумчиво: "Ты уже третий человек за последние дни, с которым я беседую на эту тему. Что-то определенно носится в воздухе."

Я рассказал об этом [info]Липке и она процитировала мне кусочек стиотворения (очень, так сказать, в тему):

Так век за веком - скоро ли, Господь?
Под скальпелем природы и искусства
Кричит наш дух, изнемогает плоть,
Рождая орган для шестого чувства

У меня тоже часто бывает такое ощущение - когда одной и той же проблемой занимаются много разных людей и рассматривают ее со всех сторон, когда чувствуется, что чего-то явно недостает и так далее. Вот и сейчас мне кажется (ко всем этим разговорам про мобильники, компьютерные игры и способы выражения), что обязательно должен появиться новый вид искусства. Ведь есть целый мир - компьютеров/игр/интернета - а "своего" искусства нет. Вот есть скажем, мир спорта, так совершенно понятно, к чему он близок - всякая там грация и т.д. А тут?

ЗЫ: А у меня у дома по газону ходят чайки. Гордо выпятив грудь. Галки, вороны и чайки. Это тоже что-то определенно означает - скорее всего то, что где-то рядом с моим домом есть море, о котором я не знаю.

ЗЗЫ: И, наконец, установилась Настоящая Питерская Погода - тяжелое серое небо и мелкая морось, которая совершенно не портит настроение.



(29 comments) - (Post a new comment)

Чайки
[info]sergeif
2004-11-05 03:01 am UTC (link)
>> скорее всего то, что где-то рядом с моим домом есть море, о котором я не знаю.
Нет, близость моря - бакланы. А чайки - огромная помойка или свалка, ну или неогромная, но тогда количество меньше.

(Reply to this) (Thread)

Re: Чайки
[info]bromozel
2004-11-05 04:31 am UTC (link)
Нет у меня свалки (как и моря, впрочем). Помойка есть, но чаек на ней нет.

(Reply to this) (Parent)


[info]sergeif
2004-11-06 01:01 am UTC (link)
А что Вы называете AI? IMHO оно с вышепреведёнными проблемами не связано.

  • Распознование образов - чисто техническая задача быстрого сравнения с образцом+

  • Генетические алгоритмы - метод нелинейной оптимизации, причём узкоприменимый. Монотонность целевой функции от взятия части и тд...

  • Вот нейронные сети, действительно могут развиться в некое подобие AI, но я не верю, что эта штука будет сама придумывать чему ей обучаться, а чему нет. Тест Тьюринга пройдёт, но опять же IMHO неадекватный.



Пока не вижу никаких подвижек в области создания AI.

(Reply to this) (Thread)


[info]bromozel
2004-11-06 01:54 am UTC (link)
Знаете, я не специалист, но вижу, что происходит вокруг. Насколько я понимаю, до сих пор нет алгоритма. который отличит изображение кошки от изображения собаки. Да что там животные! Сами же наверняка видели изобрадения цифр, которые требуют вводить при регистрации почтовогоящика и т.д. Даже это программы пока не могут! Какая уж тут техническая задача.

И генетические алгоритмы (по крайней мере теоретически) - применимы, имхо, почти везде. Вот мы сейчас пишем статью по экономике с их применением.

А вообще, наверное, просто слова "ИИ" неправильные. Я имею ввиду, что программы не умеют делатьничего нестандартного - играть на бирже и т.д. И что научить их это делать так, как это делают люди, вряд ли возможно. Т.е. для них должен быть какой-то другой способ. Но какой? Вот да, методом проб и ошибок.

(Reply to this) (Parent)(Thread)


[info]sergeif
2004-11-06 02:44 am UTC (link)


то что там при регистрации почтового ящика ломается элементарно в смысле идеи, и очень тяжко в смысле компьютерного времени. Защита против быстрой регистрации сотни ящиков сделана.

Кошку от собаки отличить на уровне цифры можно, но опять же время, и хранители информации....

Экономика, если речь идёт о вложении финансов как раз удовлетворяет ограничению про монотонность функции, но это не AI, это просто способ данный самой природой найти решение.

Генетика сделана для задач, в которых надо найти ответ, с экстремальным значением некоего функционала. Например в обработке изображений её не применить, так как ответ из некоторого нечислового множества, и с целевой функцией проблемы.

(Reply to this) (Parent)(Thread)


[info]bromozel
2004-11-06 03:20 am UTC (link)
>Генетика сделана для задач, в которых надо найти ответ, с экстремальным значением некоего функционала. Например в обработке изображений её не применить, так как ответ из некоторого нечислового множества, и с целевой функцией проблемы.

Это я как раз понимаю.

>то что там при регистрации почтового ящика ломается элементарно в смысле идеи

А как? Я даже лучше вопрос задам - представьте себе точки на плоскости. Требуется их разделить на несколько групп - по расположению. Как это сделать - алгоритм? Возможны разные постановки задачи - число групп известно заранее, не известно. Но как? У нас был такой предмет - кластерный анализ - как раз про это. И там совершенно идиотские алгоритмы. Потому что лучших, я так понимаю, нету.

В то же время любой человек мгновенно очертит вам - вот вот и вот - три группы.

(Reply to this) (Parent)(Thread)


[info]sergeif
2004-11-06 03:27 am UTC (link)

Да, потому со временем и тяжко. Я же не говорю, что есть полиномиальные алгоритмы. Точек то в изображении конечное число. 2^{количество точек} тоже конечное, разбиений на произвольные подмножества - конечное количество + оптимизации различными способами, которые можно обсудить, если хотите. В лучшем случае там рост какой-то экспоненциальный от экспоненты в степени корня 5-ой степен из числа точек. Вроде так.

Компьютер отличается от человека тем, что смотрит локально, и не видит всего в целом. Это принципиальная проблема. Любую задачу он может разбирать только частями, а мозг работает как-то по другому.

(Reply to this) (Parent)(Thread)


[info]bromozel
2004-11-06 03:29 am UTC (link)
Нет, про конечность точек, мне, спасибо, понятно :)

А критерий отбора? Проблема именно в этом.

(Reply to this) (Parent)(Thread)

Тааак. удалился длинный коммент про критерий... :(
[info]sergeif
2004-11-06 03:45 am UTC (link)
Напишу короче.

  1. Разбили точки на какие-то множества. В итоге переберём все разбиения.

  2. Решаем локальную задачу: сравнение одного множества с одним шаблоном.
    • Вводим дискретизацию растяжений шаблона по некоторому конечному, не очень большому набору прямых.
    • Сравниваем с деформированным шаблоном, если множество полностью накрывается шаблоном, то получаем некоторую вероятность, условно говоря гладко зависящую от числа точек в множестве и дискретезации деформаций
    • Выбираем шаблон с наибольшей вероятностью. Кстати, вероятность, очевидно, плохая целевая функция, это чтобы вопросы присечь.

  3. Для каждого разбиения существует некоторая вероятность, что мы угадали, она тоже является функцией от дискретезации деформации и всех точек.

  4. Выбираем наиболее вероятную.



PS Обычно хорошей итоговой вероятностью считается 70%

(Reply to this) (Parent)(Thread)

Re: Тааак. удалился длинный коммент про критерий... :(
[info]bromozel
2004-11-06 03:53 am UTC (link)
Не понимаю. Что такое шаблон?
Еще неясно, что такое дискретизация и деформированный шаблон :)

(Reply to this) (Parent)(Thread)

ОК
[info]sergeif
2004-11-06 04:08 am UTC (link)

Постановка задачи


Есть некоторое множество точек на плоскости.
Известно, что написаны именно буквы. Без дополнительной информации о характере алфавита.
Хочется понять, что написано.

Термины


Берём шаблоны букв различных алфавитов, представляющих из себя некоторые линии на плоскости.
Дискретизация по точкам - выбирается N точек на линии.
Дискретезация по направлениям деформации - лучи из выбранного набора N точек, идущих под M различными углами.
Дискретезация по величине деформации - то насколько мы вытягиваем каждую точку по лучу. Линия тянется за точкой. При этом линия деформируется только в некоторой наперёд заданной области, хотя я не настолько рублю фишку, чтобы это точно утверждать.

Некие факты. голословно


  • Есть теорема, что мы можем выбрать точки, лучи, и длины, так чтобы неошибиться с любой заданной деформацией.

  • Есть способ вычисления вероятности по дискритизации, условно гладкая означает, что если число точек - континум, углы всевозможные из каждой точки линии, то вероятность - гладкая функция.



Более детально не готов обсуждать. На вопросы по этой части отвечу.

(Reply to this) (Parent)(Thread)


[info]sergeif
2004-11-06 04:11 am UTC (link)
надо заменить
с любой заданной деформацией.
на
с любой заданной точностью

(Reply to this) (Parent)(Thread)


[info]bromozel
2004-11-06 04:15 am UTC (link)
Я догадался.

(Reply to this) (Parent)

Re: ОК
[info]bromozel
2004-11-06 04:14 am UTC (link)
Нет, речь не совсем об этом. Это я понимаю и представляю себе.
С кошкой-то такого не сделать. Да и finereader не безумно хорошо работает.

Давайте лучше про разбиение точек на две группы на плоскости. Мы ничего не знаем о форме этих двух пятен, да и вообще - пятен никаких нет, просто много точек. Как тут делать?

(Reply to this) (Parent)(Thread)

Re: ОК
[info]sergeif
2004-11-06 04:19 am UTC (link)
Боюсь, что без дополнительной информации о том, что мы ищем ничего сделать нельзя.

Знаете, у психологов показывают пациентам картинки из пятен и спрашивают, что это такое. Алгоритм вряд ли будет умнее человека, его написавшего, правда?

Про кошек кстати, определяется пропорциями тела. где тело устанавливается по эвристике с различием цвета. Вот с хамелеонами она гарантировано посыплется.

(Reply to this) (Parent)(Thread)

Re: ОК
[info]sergeif
2004-11-06 04:22 am UTC (link)
Шаблоны в случае кошек - это головы и другие части тела, которые есть в базе. И это реально осуществляется на практике.

Тут правда проблема, что надо учитывать некоторый градиент цвета и накрытие не одномерное, а уже двумерное.

(Reply to this) (Parent)(Thread)

Re: ОК
[info]bromozel
2004-11-06 04:31 am UTC (link)
Да нет, все это чепуха. Какие пропорции? Любой человек отличит кошку от собаки на детском рисунке. Комп - никогда.

(Reply to this) (Parent)(Thread)


[info]sergeif
2004-11-06 04:35 am UTC (link)
Извините, самоудалюсь из этого диалога. Устал.

Я не умею отличать кошку от собаки на детском рисунке. Вот Вы мамонта от слона на детском рисунке отличить не можете, например. Обработка рисунка, а не реального изображения это субъйективное действо. Вы не информацию извлекаете, а свои ассоциации на зрительный ряд. Это не входит в точную науку теорию алгоритмов.

(Reply to this) (Parent)(Thread)


[info]bromozel
2004-11-06 04:38 am UTC (link)
Просто мамонта дети никогда не видели.
А кошку от собаки Вы отличите. Пусть не всегда но в 99 случаях из ста.
Ассоциации, да. Числа складывать - невелика задача.
Искусственный интеллект должен в первую очередь определять есть ли буквы, а во вторую - какие они.
А насчет теории алгоритмов - потому и не входит, что алгоритмов нет. Но будут, будут...

(Reply to this) (Parent)

Re: ОК
[info]bromozel
2004-11-06 04:33 am UTC (link)
Конкретно про этот алгоритм. Он, конечно, работает в том случае, если написаны буквы так или почти ктак, как есть у нас в базе. А если они написаны корявым почерком?

И более интересен вопрос как раз буквы это или нет.

(Reply to this) (Parent)


[info]bromozel
2004-11-06 03:30 am UTC (link)
>Компьютер отличается от человека тем, что смотрит локально, и не видит всего в целом. Это принципиальная проблема. Любую задачу он может разбирать только частями, а мозг работает как-то по другому.

Это очень общие слова. Компьютер вообще работает не так, как мозг. Это и надо использовать.

(Reply to this) (Parent)(Thread)


[info]sergeif
2004-11-06 03:48 am UTC (link)
Если использовать то, что не такое же, как у мозга, то получим не интеллект, а что-то другое.

(Reply to this) (Parent)(Thread)


[info]bromozel
2004-11-06 03:54 am UTC (link)
Другое. О том и речь. Зачем нам такое же - людей-то полно вокруг и так.

(Reply to this) (Parent)(Thread)


[info]sergeif
2004-11-06 04:10 am UTC (link)
Так медленные, а способности к решению задач так и вовсе зависят от каких-то причин неконтролируемых.

(Reply to this) (Parent)


[info]bromozel
2004-11-06 01:57 am UTC (link)
Ну давайте скажем так. В сети есть вирусы. На мой взгляд - вполне себе новая форма жизни. Вот они и разовьются во что-то.

К тому же все сейчас пытаются создавать "электронных собеседников". И мне кажется вполне возможной ситуация, что через 10 лет нельзя будет отличить, кто завел себе ЖЖ - человек или машина.

(Reply to this) (Parent)(Thread)


[info]sergeif
2004-11-06 02:37 am UTC (link)

Тест Тьюринга это как раз можно ли сказать про невидимого собеседника компьютер он или человек. Да уже сейчас нельзя отличить по большому счёту. Я возьму свой журнал и очень быстро сделаю программку, которая строит рандомные тексты по тому же принципу. Разве, что придётся подумать как сделать её в меру безграммотной, как я.

(Reply to this) (Parent)(Thread)


[info]bromozel
2004-11-06 03:13 am UTC (link)
"Безграммотной" - это хорошо :)

(Reply to this) (Parent)(Thread)


[info]sergeif
2004-11-06 03:17 am UTC (link)
Мне не дано понять почему программа с двумя м, а грамота с одним.

(Reply to this) (Parent)


[info]sergeif
2004-11-06 08:55 am UTC (link)
Вот ещё ценный ресурс про распознование текста. Как хорошо, что спамеры ещё им не завладели. :) Совсем не следят за передовой научной мыслью.
www.cs.berkeley.edu/~mori/gimpy/gimpy.html

(Reply to this)


(29 comments) - (Post a new comment)

Create an Account
Forgot your login or password?
Login w/ OpenID
English • Español • Deutsch • Русский…