Рубрика: Жизнь

О жизни…

Игра Study Maths

ТЕМА НА GAMEDEV.RU

Мне лень писать что-то, так что копирую оттуда.

Всем привет.
Мне тут вздумалось погрузиться в дебри нейросетей и запилить быстренько приложение, которое позволяет распозновать рукописные (нарисованные на сенсорном экране пальцем или еще чем-то) цифры. Самая простая идея: игра – обучение/тренировка арифметике. Игроку предлагается некий простенький пример, он решает его и пишет ответ, система распознает и говорит «верно»/»неверно». Можно еще добавить очки или ограничить время. Тут недавно была похожая тема, но у меня акцент именно на рукописном способе ввода.

Название: Study Maths (рабочее, возможно, сменится)
Жанр: обучающая головоломка
Начало разработки: 19 февраля 2013 года
Текущий статус: есть демка с базовым функционалом
Язык, API: Obj-C, Cocos2D-iPhone

Пока поддерживаются операции сложения (от 0 до 19), вычитания (без отрицательных), умножения (до 10 * 10), деления (на ноль нельзя!).

На алгоритм распознавания потратил очень много времени: почти неделю. Но пока он далек от совершенства. Я использую 5 слойную сверточную нейросеть, наученную на базе рукописных цифр (MNIST, 600000 цифр). Отсюда вытекает главная проблема: в базе цифры написаны ручкой на бумаге, потом отсканированы. У меня же они пишутся пальцем на экране, рендерятся в текстуру и идут на нейросеть. После нейросети есть еще пара хаков: например, моя рукописная 6 всегда почти распознается, как 5. Пришлось использовать некоторые свойства кривых, чтобы различать их. И то, не всегда успешно. Также алгоритм разделения кривых на цифры, который я придумал сегодня утром, иногда сбоит и нуждается в явной доработке. Хочу добавить еще знаки «+» и «-«, позже «.».

Еще есть концептуальная идея прикрутить к этому делу CMU Sphinx и какой-нить text-to-speech, получим, таким образом, и чисто голосовой вариант. Игра читает игроку пример, игрок отвечает голосом, получает одобрение или наоборот. Обязательно попробую в скором времени, если пойдет гладко (справлюсь менее, чем за неделю), то 100% включу в проект.

Дневник разработки:
19.02.2013 Начало

26.02.2013 Добавлена озвука примеров и результата на аглийском Flite text-to-speech

27.02.2013 Добавлена поддержка распознования голоса (см. видео со звуком):

К сожалению, результат меня сильно не устраивает. Слишком мала точность, требуется тишина, трудно сделать русский язык, приложение очень сильно разбухает в объеме. Так что в первом релизе скорее всего распознования голоса не будет. Я пока не знаю, как улучшить распознования голоса, т.к. использую сторонний API.

Media Markt

Был сегодня в нашем первом нижегородском Media Markt на Комсомольской, магазин порадовал шириким (очееень широким) ассортиментом. Действительно, выбор товаров серьезнее, чем в М-Видео и Эльдорадо вместе взятых. Цены немножно странные, целенаправленно не сравнивал. Одни товары кажутся дешешвле, другие дороже. Например, вчера купили Smart Cover в Белом Ветре за 2600 (хотя на сайте цена 3100), а в Media Markt он — 3100 руб. Съезжу потом туда на, рассмотрю все подробнее.

[yandexMap name=»Медиа Маркт» width=»575″ height=»500″]Нижний Новгород, Комсомольская площадь, дом 2[/yandexMap]

Конец рынку на Советской

Ура. Кажется, его почти целиком снесли. Не знаю, что будет на том месте, скорее всего торговый центр. Не важно. Главное не будет этой дыры. Я как ярый рынконенавистник (кроме радио, естественно) очень рад. Да ладно вам, бабушки, ходите уже в супермаркет; достаточно много продуктовых магазинов в вашем районе. Вот все, что отсталось от рынка на Советской. Говорят, его частично перенесли куда-то к РР.

[singlepic id=931 w=575]