Новые материалы по курсу "Интеллектуальные системы"

Обновлен раздел по дисциплине Интеллектуальные системы: выложены новые материалы лекций (по генетическим алгоритмам, интеллектуальному анализу данных, ассоциативным моделям знаний), дополнены списки литературы и ссылки. Читать далее
Рубрика: Обновление сайта | Оставить комментарий

Первая лекция в ОтУс

21 апреля прошла первая лекция в Открытом университете Сколково. В качестве лектора был приглашен Уильям Хазелтайн – всемирно известный ученый и предприниматель, один из первых исследователей в области СПИДа, основатель компании Human Genome Sciences Inc.

Он поделился своим опытом и выделил главные вещи. Вот основные, на мой взгляд, тезисы:

1. Необходимость привлекать лучшие умы, чтобы они были заинтересованы развивать науку в течении многих лет. То есть недостаточно просто пригласить хороших специалистов, необходимо также их заинтересовать.

2. Недостаточно просто дать человеку образование и среду — необходимы две вещи:

1)примеры 2) свобода.

Под примерами он имеет в виду следующее:

Во-первых, необходимо выделить великую проблему, которой хочешь заниматься всю жизнь. (Это уникальная характеристика — уметь признавать великую проблему)

Во-вторых, необходимо иметь хорошего наставника. Чтобы решить проблему, которую ты выбрал для себя, нужно найти лучшего специалиста во всем мире и ехать к нему.

Под свободой понимается то, что тебе не говорят конкретно что делать, какой проблемой заниматься. Ты должен сам ставить перед собой задачу и самостоятельно отвечать за свой выбор, конкурировать с другими специалистами, которые также работают в этой области.

3. Необходимо найти баланс между интересами науки и бизнеса. Ему, например, с самого начала своей деятельности приходилось кроме занятий исследованиями находить деньги на реализацию своих проектов, выигрывать гранты. Для этого надо «чтобы тебя знали», а значит много публиковаться и ездить на конференции. Это был его «бизнес». Получается, что бизнес и наука имеют много общего.

достижения  -> публикации -> деньги

4. Университет — инструмент, который дает образование и ответы на вопросы.

5. Прежде чем начать чем-то заниматься, нужно ответить на следующие вопросы:

1) необходимость

2) готовность технологий

3) есть ли люди, которые будут этим заниматься (готовы ли они)

Хотелось бы отметить, что научно-образовательный кластер CLAIM как раз действует в этом ключе 🙂

1) лучшие научные руководители

2) площадка для публикаций

3) средство коммуникации студентов и аспирантов

4) информация о конкурсах и грантах

5) участие в конкурсах и получение грантов

p.s. заметка написана совместно с коллегой Ириной Даньшиной

Рубрика: Без рубрики | Комментарии к записи Первая лекция в ОтУс отключены

Иллюстрации к методике перевода знаменных песнопений

Решила попробовать новый инструмент для разработки презентаций (что-то, кроме MS PowerPoint или MS Visio) и нашла программу, которая называется SmartDraw (http://www.smartdraw.com/). Мне она очень понравилась! Огромный выбор библиотек, удобство создания схем и иллюстраций. К сожалению, она платная, но есть возможность воспользоваться бесплатной версией для ознакомления в течении 7 дней.  Советую попробовать. Если вы знаете аналогичные бесплатные программы, посоветуйте, пожалуйста)))

Итак, вот иллюстрации, которые удалось нарисовать для презентации к диплому:

1. Хранение Сборника попевок

2. Хранение двознаменника

3. Хранение словаря

4. Хранение перевода крюковой рукописи

Рубрика: Без рубрики | 1 комментарий

Требования к статьям в международных конференциях по компьютерной лингвистике ACL

Крупные конференции по компьютерной линвистике, такие как ACL, NA ACL, EACL, EMNLP, предъявляют высокие требования к публикациям. Как правило, принимаются два типа публикаций — полные статьи (8 страниц + 1-2 страницы библиографии) и короткие статьи (4 страницы + 1 страница библиографии). Полные статьи должны представлять завершенное исследование, в то время как короткие представляют незавершенное исследование (ongoing research), либо презентуют систему. Исследование приведшее к негативному результату тоже следует оформить как короткую статью:
Читать далее

Рубрика: Анонс события, Конференции, Мероприятия | Оставить комментарий

Даже большие проекты начинаются с малого

Сейчас в Интернете поднялась шумиха относительно сайта иннограда Сколково, который в результате DDoS-атаки уронили пользователи сообщества habrhabr. Пытаясь привлечь к себе внимание, они скачали сайт и предоставили его для скачивания широким массам в удобном формате. Обе эти операции являются прямым нарушением гражданского и уголовного кодекса РФ.

Очень интересным оказался факт разработки сайта на базе то ли  шаблона от Joomla, то ли UMI-cms (http://www.i-gorod.com/admin/content/sitetree/). Это привело в «восторг» многих веб-разработчиков, которые ожидали от инновационного проекта чего-то невероятного, особенно за 3 млн. рублей. При этом они конечно забыли, что это деньги не в конверте, а полностью официальные — а это значит, НДС (18% — 540000) и другие налоги (грубо — 34%), после чего остается 1,6 млн. А если еще с них взять 13%, то останется около 1,4 млн. Кроме того, нужно понимать, что структуру сайта (контента) надо придумать, заполнить без ошибок ), а самое главное согласовать с большими чиновниками, а еще надо заплатить бухгалтеру, менеджеру, за оборудование, программное обеспечение, электричество и т.д., необходимые для их работы.

Я не берусь судить на сколько правильно были потрачены деньги и хорошо выбрано техническое решение, но главное — это то, что даже Сколково начинается с малого. Это значит, что каждый может достичь боьших успехов и отстуствие или даже наличие больших денег не оказывают на это решающего влияния!!

Ps: Сообщение написано от меня, Филипповича Андрея,  согласно моей должности модератора ))  На будущее очень прошу всех писать по существу, отражая корректные и взвешенные позиции, а еще лучше — писать по теме своей научной или практической работы. Тем не менее, ваши мнения очень важны для меня и их тоже можно писать, но соблюдая рамки приличия, законности и конструктивности.

Рубрика: Без рубрики | Комментарии к записи Даже большие проекты начинаются с малого отключены

Перевод попевок с помощью двознаменника

В рамках проекта исследуется два типа рукописей — в крюковой нотации и двознаменники (крюковая и нотная нотации). Интересным вопросом является выяснение встречаемости и перевода попевок из Сборника попевок Соловецкого собрания в крюковой рукописи «Круг древнего знаменного пения». При этом Сборник представляет собой перечисление попевок в крюковой нотации. Таким образом можно попробовать перевести попевки из сборника с помощью двознаменника, а затем проверить и перевести Круг с помощью уже переведенных попевок. Второй частью исследования является попытка перевода Круга непосредственно с помощью двознаменника (возможно с применением теории статистического перевода).

В данной статье я рассмотрю первый этап исследования — перевод попевок с помощью двознаменников.

Пример страницы рукописи Сборника попевок:

Пример страницы Круга

Пример страницы Двоезнаменника

Рассмотрим структуру используемых таблиц.

1) структура таблиц, используемых для хранения попевок

2) структура таблицы двознаменника

3) хранение переводов

Пользователь выбирает Таблицу попевок, которую он хочет использовать для перевода, Рукопись с помощью которой необходимо осуществить перевод. Также он задает в специальном поле какие именно попевки он хочет перевести (номер). Если он выберет те, что уже были переведены с помощью данной рукописи, перевод будут переписан. Так как перевод рукописи в электронный вид осуществлялся вручную, она содержит ошибки, связанные в первую очередь с несовершенством шрифтов, наличием похожих знамен, человеческим фактором. Эти ошибки могут быть исправлены при проверке, поэтому ожидается, что если при переводе оказалось, что данная попевка уже обрабатывалась, то мы можем переписать ее перевод, так как он должен быть более правильным. Для сохранения текущей версии перевода предполагается его сохранение в XML-файле.

Рассмотрим структуру таблиц:

Таким образом, перевод попевок будет «собираться» из двух основных таблиц — двознаменника и сборника попевок.

Но переводов одной попевки может быть несколько. Во-первых, он будет зависеть от источника перевода (конкретной рукописи), а во вторых, его может предложить эксперт-музыковед, который занимается исследованием древнерусских музыкальных рукописей.

Для этого предлагается ввести дополнительную таблицу-справочник «Источник перевода», а также таблицу «Где перевод». Эта таблица будет связывать таблицу, в которой хранятся знамена для перевода и сборник попевок. Она будет состоять из двух полей — Id источника перевода и Id записи в нем. Далее дана структура таблиц. Сразу хочется оговорится — она не окончательная, я хотела бы над ней еще поработать. В частности — изобразила связь нескольких двознаменников в таблице  «Где перевод» с помощью элемента категоризации сущностей.  Не уверенна, что он тут уместен, но схематически, как мне кажется, отражает то, что я хочу передать (возможность сохранения нескольких переводов одной попевки). Схема спроектирована в ERwin.

Для того чтобы удобнее было производить исследования, необходимо учесть то, что анализ попевок может происходить как с учетом слов, так и без их учета. Поэтому в результирующей таблице хранятся не итоговые значения нот, а ссылки на записи в двознаменнике и сборнике попевок, чтобы в процессе исследования можно было обращаться к другим атрибутам таблицы и выбирать их по отдельности.

Рубрика: Без рубрики | Комментарии к записи Перевод попевок с помощью двознаменника отключены

Тестирование Kinect 2

Продолжая эксперименты с Kinect, пришлось постигать азы OpenGL. Долго провозился с сопоставлением цветного изображения от камеры с картой глубины. Думал, что несоответствие связано с особенностями хранения изображений в OpenGL. Оказалось, что смещение было вызвано аппаратными особенностями камеры — объектив камеры и ИК-сенсор физически находятся на некотором расстоянии друг от друга.
Читать далее

Рубрика: Kinect, Проект | Комментарии к записи Тестирование Kinect 2 отключены

Семинар молодых ученых RCDL2011 — Срок подачи тезисов докладов завершаетс​я 15 апреля

Семинар молодых ученых «Диссертационные исследования по тематике информационных технологий, связанных с электронными библиотеками»

Воронеж, 19-22 октября 2011 года

Срок представления расширенных тезисов докладов — 15 апреля 2011 г.

Семинар «Диссертационные исследования по тематике информационных технологий, связанных с электронными библиотеками», организуется в рамках XIII Всероссийской научной конференции «Электронные библиотеки: перспективные методы и технологии, электронные коллекции» — RCDL-2011.
Семинар ориентирован на молодых ученых, выполняющих диссертационные исследования по технологиям электронных библиотек и по другим направлениям тематики информационных технологий, связанным с электронными библиотеками.

Цель семинара — предоставить диссертантам возможность:
• представить текущие результаты и идеи их исследований более опытным коллегам;
• обсудить слабые и сильные стороны, а также направления дальнейшего развития проводимых исследований;
• установить контакты для научного сотрудничества;
• развить навыки выступлений на научных конференциях.

Участники семинара смогут также принять участие в других мероприятиях программы конференции RCDL. Тематика конференции и другие сведения для участников представлены на сайте http://rcdl2011.vsu.ru/. Читать далее

Рубрика: Анонс события, Конференции, Тезаурусы и онтологии | Оставить комментарий

Новые публикации

 Опубликованы pdf-версии 8-го и 9-го выпуска Сборника статей аспирантов и студентов "Интеллектуальные технологии и системы". Ищем способных студентов, которые переведут все сборники в html и помогут разработать общую систему ведения публикаций на сайте.
Рубрика: Обновление сайта | Оставить комментарий

Обучающая система.

Обучающая выборка (training sample) — выборка, по которой производится настройка (оптимизация параметров) модели зависимости.

Если модель зависимости построена по обучающей выборке X в степени m, то оценка качества этой модели, сделанная по той же выборке X в степени m оказывается, как правило, оптимистически смещённой. Это нежелательное явление называют переобучением. На практике оно встречается очень часто. Хорошую эмпирическую оценку качества построенной модели даёт её проверка на независимых данных, которые не использовались для обучения.

Рубрика: Без рубрики | Комментарии к записи Обучающая система. отключены