Soloviov.ru / Веб для бизнеса

Сергей Соловьев о применении веб-технологий с пользой для бизнеса

Опубликовано: 24.05.2010, 23:19

Автоматическое тегирование контента — утопия?

Hard Rock Cafe

Еще пара слов о таксономии. Все уже знают, что в социальных сетях генерируется масса контента, который надо организовывать. Некий гений придумал его тегировать, создав, тем самым, саморегулирующая систему. Это превосходно.

Но сегодня активные пользователи социальных сервисов уже начинают уставать от этого. Когда я выкладываю очередную порцию фотографий в свой блог на Flickr.com, я каждую аккуратно тегирую, чтобы другие пользователи сервиса могли их удобно находить. Но для альбома в 30 фото (к примеру) это занимает добрые полчаса.

Решение этой проблемы довольно очевидно, но, конечно, пройдет какое-то время до того, как оно будет внедрено во все массовые сервисы. Но подумайте сами, насколько было бы удобно, если бы сервис предлагал релевантные теги автоматически! В этом нет ничего принципиально невозможного: необходимо просто анализировать контент.

Если на фотографии изображена вывеска Hard Rock Cafe, вполне можно догадаться предложить теги “hardrock”, “cafe” и “citylife”. Если в статье блога встречаются слова “афиша” или “фильм”, то можно предложить тег “movies”. Наконец, если загружаемый в корпоративный портал файл формата DOC(X) имеет в названии или в “Заголовке 1” слово “отчет”, то давайте предложим его тегировать словом “отчет”!

Самое прекрасное, что систему даже обучать насильно не надо: она научится сама с течением времени, ведь в ее распоряжении — большая база пользователей, которые уже аккуратно тегируют контент. На основе этой статистики и следует выбирать предлагаемые теги.

Конечно, потребуется научить системы распознавать графические изображение предметов, но ведь iPhoto и Picasa уже умеют это делать с человеческими лицами и хорошо находят похожие!

Приятно то, что это уже начинают понимать. Delicious.com и Last.fm уже давно предлагают теги автоматически именно по этому принципу. Лично я пользуюсь, и очень доволен результатом.

Как вы считаете, где еще можно применять тот же принцип? Давайте накидаем идеи для компаний-монстров, чтобы взяли на вооружение?

Notes

  1. soloviovru posted this