Soloviov.ru / Веб для бизнеса

Сергей Соловьев о применении веб-технологий с пользой для бизнеса

Опубликовано: 24.05.2010, 23:19

Автоматическое тегирование контента — утопия?

Hard Rock Cafe

Еще пара слов о таксономии. Все уже знают, что в социальных сетях генерируется масса контента, который надо организовывать. Некий гений придумал его тегировать, создав, тем самым, саморегулирующая систему. Это превосходно.

Но сегодня активные пользователи социальных сервисов уже начинают уставать от этого. Когда я выкладываю очередную порцию фотографий в свой блог на Flickr.com, я каждую аккуратно тегирую, чтобы другие пользователи сервиса могли их удобно находить. Но для альбома в 30 фото (к примеру) это занимает добрые полчаса.

Read More

Опубликовано: 16.10.2009, 20:10

По дороге с облаками (и тегами)

По дороге с облаками

Подход UGC (контент, генерируемый пользователями) несомненно подарил Интернету новую жизнь. На высокопосещаемых ресурсах пользователи - это большая движущая сила, которая сворачивает горы и бесплатно создает массу информации разной степени полезности. Все приемы, обеспечивающие легкость создания и публикации контента пользователями, быстро были взяты на вооружение бизнесом, и теперь активно внедряются в разнообразные веб-продукты.

При этом на базе фундаментальной идеи многопользовательской системы с распределенными правами возникло великое многообразие решений и видов контента:

  • Статьи в корпоративных блогах
  • Фотоотчеты с мероприятий (выставки, форумы, презентации)
  • Файлы в системах совместной работы
  • Проекты и Задачи в корпоративных порталах

Все это - востребованная информация. И она генерируется с очень большой скоростью. А вместе с ростом объема информации ее становится сложнее искать. Решение этой проблемы тоже уже есть в виде инструмента - как правило, это теги.

Небольшой ликбез

Теги представляют собой текстовые ярлыки (буквальный перевод), присваиваемые единицам контента в системе. На основе базы тегов можно сформировать навигацию, которая позволяет фильтровать контент.

Теги не имеют внутренней структуры - это просто набор меток, не имеющий взаимного подчинения и иерархии. Каждый тег может встречаться в системе много раз, и каждая единица контента может помечаться несколькими тегами. Видимо, поэтому наиболее популярным способом представления тегов на сайтах стало облако: алфавитный список меток, размер шрифта которых отражает частоту использования. Чем крупнее тег, тем больше на сайте единиц контента, которые им помечены.

Таким образом, облако тегов дает неплохое представление о тематике ресурса с первого взгляда.

Любопытно то, что имея такой превосходный инструмент, его очень часто используют не очень умело. Разумеется, он изначально был создан для неконтролируемой среды пользователей. Предполагается, что за счет огромной массы пользователей, которые в среднем мыслят схожим образом, навигация на базе тегов будет адекватно отражать реальный состав контента.

Но уж если задумываться о том, как использовать UGC в бизнесе, то совершенно естественно будет поискать возможность дополнительных выгод. В вышеперечисленных примерах аудитория сервисов поддается некоторому контролю. Корпоративный блог ведет не кто попало, а маркетологи с определенными целями. Проекты и задачи сами по себе формируют некоторую структуру со своими правилами. И файлы тоже, как правило, создаются по поводу, а не по настроению, а поводов таких внутри компании - ограниченное количество.

Ну, а раз так, то полезно вместо стихийных паттернов создать обдуманные. И если облако тегов начнет выполнять функцию навигации на порядок эффективнее, это значительно облегчит жизнь тем, кому потребуется что-либо найти в море корпоративной информации.

Принципы тегирования

Идея заключается в том, чтобы выработать некоторые несложные правила, по которым будут присваиваться теги. Самое простое - определить набор признаков, по которым может классифицироваться контент. Цель - обеспечить попадание каждой единицы контента в каждую классификацию, чтобы исключить выпадание из навигации. Представить это абстрактно нелегко, поэтому поясню на примерах.

В зависимости от типа контента набор признаков может варьироваться:

  • Текстовый контент (например, статьи в блоге) характеризуется:
    • Темой (на soloviov.ru к ним относятся Контент, Навигация, Эффективность, Интерфейсы и т.п.)
    • Упоминаемыми именами персон и названиями компаний
    • Упоминаемыми распространенными терминами (на soloviov.ru к ним относятся RSS, SaaS, PM и т.п.)
    • Автором (в общем-то не тег, но почему бы не включить в облако?)
  • Для каждого изображения (фотографии с мероприятий) можно указать:
    • Тип, тематика или название мероприятия (подумайте, что чаще будут искать)
    • Место проведения
    • Степень формальности (“официальное” / “без галстука”)
    • Имена персон, изображенных на фото
    • Вид (ландшафт/портрет/помещение)
  • В коллекции ссылок (закладки, публикуемые публично, как экспертные библиотеки) каждая имеет признаки:
    • Язык материала
    • Географическая привязка (страна или город, если предложение сайта применимо к определенному региону)
    • Тематика (вполне может быть несколько)
    • Коммерческое или бесплатное предложение (при классификации услуг
    • Public / Private (при классификации компаний)
  • Файлы можно классифицировать по:
    • Типу документа (КП, ТЗ, Бриф, Макет, Отчет)
    • Подразделению (Маркетинг, Производство, Финансы, Управление)
    • Году/кварталу/месяцу (полезно для регулярных документов, например, отчетов)
    • Статусу (черновик/утвержден, внутренний/внешний)

Список, разумеется, неполный. Развивайте идею, изучая собственные потребности.

Наличие подобной системы позволяет на 100% использовать преимущества аккумулятивной фильтрации, при которой при поиске выбирается сразу несколько тегов.

Примеры:

  • Показать все статьи об эффективности, где упоминается Сергей Соловьев
  • Нужны все фотографии с форума Internet World 2008 года со стендом компании LinkedIn
  • Выбрать все ссылки, помеченные “русский”, “софт”, “бесплатный”, “управление проектами”

Если расстановка тегов была осмысленной, можно быть уверенным, что в выборку действительно попадет весь контент, который относится к запросу. Это особенно важно, когда контент не дублируется в системе. Например, при поиске квартальных отчетов: каждый из них обычно - в одном экземпляре.

Изюминка

Хорошая идея, приносящая пользу - это прекрасно. Но любую идею можно испоганить технической реализацией. Поэтому, чтобы действительно решить проблему, и не создать новые, при проектировании модуля тегирования в системе обратите внимание на следующие инструменты:

  • Переименование тегов (система должна эволюционировать)
  • Слияние тегов (для ликвидации похожих тегов)
  • Автоподсказки при назначении тегов (подсказки из числа существущих тегов во время набора)
  • Генерация RSS по тегу и комбинации тегов (дает потрясающие возможности интеграции)
  • Исключающая фильтрация (позволяет выбрать контент с тегами “форум”, “2009”, но исключить контент с тегом “без галстука”)
  • Создание групп тегов (да, это уже создает иерархию, но часто бывает очень удобно)
Опубликовано: 03.08.2009, 22:31

Чук vs. Гек или противоречия парадигм

Чук vs. Гек или противоречия парадигм

Сегодня меня потянуло на вечные вопросы. Даже в сфере веб-разработки их набирается не так уж и мало. За десятилетия развития компьютерных интерфейсов люди придумали множество методов общения с пользователем и работы с данными. И вроде бы все должно быть на пользу, и все должны быть счастливы, но пользователи по-прежнему путаются испытывают дискомфорт и напрягаются.

Удивляться этому, конечно, не приходится - слишком люди разные. У всех разные способы мышления, разная степень самоорганизации и привычки думать - тоже разные. Поэтому ответы на многие вечные вопросы отличаются - в зависимости от… а вот об этом поподробнее.

Итак, сегодня рассматриваем столкновение различных парадигм, используемых при работе с информацией вообще и на сайтах в частности:

  • Поиск и Просмотр
  • Навигация и Структура
  • Папки и Теги
  • Сортировка и Фильтрация

Поиск и Просмотр

Поиск - способ добраться до нужного контента, задав сайту вопрос.
Просмотр - способ сделать то же самое через навигацию, предложенную сайтом.

Если очень приблизительно, половина пользователей предподчитает перемещение по структуре, потому что не верят в эффективность поиска, а другая половина предподчитает искать, потому что так быстрее.

На самом деле, есть сравнительно объективный критерий для выбора парадигмы для данной задачи. Он работает в большинстве случаев:
Если речь идет о собственном контенте пользователя, проще использовать навигацию (он ведь сам ее создал, верно?).
Если имеем дело с чужим контентом, проще искать.

Выводы:

  • На публичной части сайта имеет смысл делать акцент на поиске. Примерами могут быть:
    • Общая лента любой социальной сети на базе контента (Хабрахабр)
    • Раздел пресс-релизов на копоративном сайте
    • Весь Интернет (Google)
  • В закрытой части сайта имеет смысл делать акцент на структуре. Примеры:
    • Google Docs (навигация через папки и теги)
    • Управление своими фотографиями на Flickr (навигация через теги)
    • Любой сервис электронной почты (кстати, вот это на грани, на самом деле)

Навигация и Структура

Навигация - набор всевозможных меню для перемещения по сайту, проще говоря, ссылки.
Структура - реальная группировка страниц сайта в разделы и подразделы.

Очень многие пользователи быстро теряют связь между навигацией, которую видно на публичной части сайта, и структурой, которая создается в системе управления. Это происходит потому, что CMS отделяют одно от другого и позволяют редактировать независимо (для гибкости). В результате визуальной взаимосвязи нет, возникает куча недоразумений и сложность в общении.

Буквально на прошлой неделе я, в очередной раз, полчаса объяснял отличие Заказчику. Кажется, удалось донести идею :)

Папки/Рубрики и Теги

Папки/Рубрики позволяют группировать контент по теме.
Теги делают то же самое.

При этом, в обоих случаях нет ограничений на принадлежность к папкам или тегам. Любой странице можно происводит несколько тегов, но ее также можно включить и в несколько рубрик.

Принципиальное отличие (это и рекомендация разработчикам, в том числе!) - Папки/Рубрики предполагают наличие своей собственной иерархии. Внутри папки могут быть другие папки, формируя многоуровневую структуру.

К тегам правильнее относиться, как к ярлыкам. Вы можете фильтровать свой контент по нескольким тегам одновременно, но сами теги не имеют между собой никаких отношений - структура отсутствует.

Выбор парадигмы, в данном случае, определяется степенью пересечения контента. Если группы контента часто пересекаются, лучше использовать теги, и наоборот.

Сортировка и Фильтрация

Сортировка - расположение элементов в списке с определенном порядке.
Фильтрация - отсеивание из списка элементов, не удовлетворяющих заданным критериям.

Путаница здесь объясняется двусмысленностью слова “сортировка” в русском языке. В повседневной жизни этим словом обозначаются оба понятия, но в интерфейсах, как видите, есть принципиальная разница.

Поскольку бороться со стереотипами крайне сложно, есть мнение, что проще адаптировать интерфейс. Но подобные решения работают далеко не всегда.

В реальных интерфейсах, на самом деле, это не играет большой роли. Если не с первой, то со второй попытки пользователи понимают, как это работает на конкретном сайте. Сама же парадигма вполне однозначно определяется реальной задачей интерфейса: всегда понятно, что нужно сделать - отсортировать или отфильтровать.

Гораздо больше трудностей это создает во время общения внутри проектной команды в ходе разработки сайта, поэтому на начальном этапе проекта важно определиться с терминологией.

Мораль

  1. Давайте проектировать интерфейсы осознанно. Пользователи будут благодарны.
  2. Старайтесь использовать в речи и документах одни и те же слова для одних и тех же терминов и приводите примеры.
  3. Не пренебрегайте энциклопедиями.
Опубликовано: 19.06.2009, 00:29

Индексные страницы на веб-сайтах

Во время разработки веб-сайта весь его контент укладывается в определенную структуру. Она имеет несколько уровней и группирует контент по темам. При этом в навигации появляются ссылки на страницы, которые являются лишь контейнером, но не собственно контентом - страницы разделов или индексные страницы.

Я часто вижу, что эти страницы выглядят достаточно бледно, поскольку редакторы в муках рожают описательные тексты только для того, чтобы страница не была пустой. А как еще можно заполнить страницу раздела, основное назначение которой - навигационное, а не содержательное?

Индексная страница на Apple.com

Есть несколько вариантов поведения и наполнения индексных страниц. При этом те, что я назову первыми, всем знакомы, последние же варианты часто забывают. Надо сказать, что все варианты легко реализуются в современных системах управления контентом, но каждый вариант подойдет определенному классу сайтов.

Вариант 1 - Наполнить контентом

Да, первое, что приходит в голову - это: раз есть страница, у страницы должен быть контент. Абсолютно верное и ожидаемое решение для рядового пользователя. Тем не менее, это может стать головной болью редакторов сайта, которым отдел маркетинга составил плоский текст для сайта без учета таких особенностей, как структура навигации.

Данный вариант хорош для промо-сайтов и небольших корпоративных сайтов, где страниц немного. В этом случае можно не полениться написать контент, использовать сложную верстку, и страница станет яркой и будет работать.

Сайты банков тоже часто увлекаются именно этим вариантом, но именно поэтому они скучнее других - ведь страниц там обычно немеряно. Например, на сайте Номос-банка дизайнеры выжали из страницы все, что могли, но ведь все равно скучновато!

Вариант 2 - Отображать список содержимого раздела автоматически

Частным случаем первого варианта можно считать текст, содержащий гиперссылки на страницы уровнем ниже. Но согласитесь, гораздо удобнее и проще управлять сайтом, который способен сам строить навигацию, в частности, на индексных страницах. Классическим примером таким страниц служит лента новостей или публикаций блога. Другим классическим, но уже сложным примером будет страница каталога продукции со списком анонсов или витриной.

Но не сдерживате свою фантазию на этом. Можно все сделать еще интереснее! Если на Вашем сайте есть контент, который поддается структурированию, то можно создать для него особенную, индивидуальную навигацию. Например, информацию о географических объектах, можно автоматически показать на карте. С таким наполнением Ваш раздел будет выглядеть интереснее, а поиск нужного подраздела станет быстрее и проще.

Примеры:

Вариант 3 - Запретить просмотр

Можно построить навигацию сайта таким образом, чтобы пользователям просто не требовалось посещать страницы разделов, которые группируют ссылки в меню. Если на сайте всего 2 уровня навигации, таким решением может быть всем известное выпадающее меню. Если уровней больше, то и выпадающее меню может стать насыщеннее!

Такой вариант больше подойдет сайтам, на которых состав разделов меняется нечасто, поскольку подобные меню иногда не удается автоматизировать, и они обновляются вручную.

Вариант 4 - Перенаправлять внутрь раздела

Наконец, если предыдущие варианты Вас чем-то не устраивают, рассмотрите вариант, при котором при клике на ссылку раздела происходит перенаправление пользователя в выбранный подраздел на уровень ниже. В этом случае, пользователь как будто проскакивает страницу раздела, сразу получая проработанный контент вместо сырого вступления.

Пример реализации можно увидеть на сайте ХМЛК: если кликнуть на ссылку “Наши направления” в основном меню, вы сразу окажетесь в подразделе “Лизинг для энергетики”.

Данный вариант рекомендую использовать аккуратно, поскольку поисковые системы относятся к перенаправлениям с подозрением. Необходимо убедиться, что поисковикам отправляются правильные коды причин перенаправления, чтобы ранжирование Ваших страниц не пострадало.

Мораль

Не забывайте о том, что к любой проблеме можно подойти с двух сторон: либо попытаться ее решить, либо попытаться от нее избавиться. Последний подход часто может сэкономить массу усилий!