Идея о супер-гипертексте

В далеком 2006-м году некто Роман Иванов (kukutz) со товарищи еще работали активно над замечательным вики-движком под названием wackowiki. И, как говорится, «я там был, мед-пиво пил». В том числе упоминалась такая бредовая идея о супер-гипертексте (текст той моей заметки копирую здесь — а ну как wackowiki.com окончательно сдохнет?).

И можно об этом и не вспоминать, но вот на днях наткнулся на Хабре на заметку о плагине Hyperwords. Очень похоже, да… Воистину «Идея бродит по Европе, идея гипертекста». :) Хотя реализация совсем другая.

Но я бы выделил в той заметке еще 2 идеи, которые по-прежнему не вполне реализованы: «смысловую навигацию», т.е. семантический веб, котором сейчас много разговоров, и «динамический гипертекст» — «гипертекстовая разметка будет тогда динамической, она будет меняться в зависимости от «жизни» Сети (появились или пропали новые ресурсы на какую-то тему — появились или пропали ссылки в тексте)».

Текст с wackowiki.com (2006-06-07 13:56:08):
Идея Супер Гипер Текста

Как вам такая бредовая идея (может быть и «велоcипед», зато с моторчиком :-) -
В обычном ГиперТексте:
* Ссылками являются НЕКОТОРЫЕ слова/словосочетания на странице сайта
* Гиперссылки создаются АВТОРОМ

В СуперГиперТексте:
* Ссылками являются ВСЕ слова/словосочетания на странице (за исключением служебных — предлоги, междометия и т.п.). Фантазируя дальше: все изображения и даже элементы изображений (распознавание образов?).
* Гиперссылки формируются АВТОМАТИЧЕСКИ: адресом ссылки с какого-либо слова/словосочетания становится страница, наиболее релевантная этому слову/словосочетанию.

Страницы можно брать из базы какой-либо поисковой системы (к примеру, Яndex'а) [1].
Лучше давать возможность пользователю выбора target-страницы из списка 3—5 наиболее релевантных страниц. Еще лучше, чтобы это были не просто названия страниц, а «контекст» (скажем, фрагмент текста до и после искомого слова/словосочетания). Совсем хорошо — автоматическое аннотирование текста страницы [2].

Технически, чтобы ускорить доступ к target-страницам, можно сделать так, чтобы сервер отдавал страницу пользователю и сразу готовил бы кэш из набора релевантных страниц для всех значимых слов страницы. Но это, вероятно, увеличит загрузку сервера невероятно :-)…
Тут можно предложить, скажем, оценивать «вероятность» возможного запроса по словам, имеющимся на странице (через частотность по словарю? популярность по статистике запросов?), и делать кэш только для наиболее вероятных запросов.

Этот механизм супер-гиперссылок имеет, imho, сходство с одной из базовых идеей Wiki: автоматически генерируемые ссылки.
В качестве «игрушечного» варианта, модели СуперГиперТекстовойСети, можно построить гиперWiki на этих правилах (т.е. ограничиться супергиперссылками внутри Wiki).

Прошу прощения за столь неструктурированный бред…

[1] По-моему, есть такой плагин к IE — выделяешь слово, в меню по правой кнопке мыши появляется пункт типа «искать слово в Google». Да, вот и в «Опере номер семь» тоже есть такое.
«Идея бродит по Европе, идея гипертекста» (с) Krl Mrx

[2] Тоже пробегала как-то утилита для аннотирования (смыслового «сжатия») текстов. Может и по алгоритмам что-то было…
ВадимБарсуков

YuriMakarov Я видел похожую вещь. Есть такой броузер — NetCaptor. Точнее это оболочка для IE. В нем была такая компонент, название подзабыл, но что-то вроде FlySwat. Это как я понял отдельный продукт, который поставлялся в комплекте с рекламными целями. У меня эта штука работала только с броузером, но как я понял, она может встраиваться и в другие приложения, например текстовые процессоры.

* /Ку Ме: Да, да. Такая идея, как аналог сервиса ORFO уже мелькала.

Работала она так. При открытии страницы, через небольшое время, часть слов и фраз на странице подсвечивалась. При нажатии на них (или правой кнопкой мышы, не помню) вываливалось меню с несколькими пунктами типа — Описание (Description), Обучение, Документация, Купить… Точный набор пунктов не помню, вариантов было много, в зависимости от типа объекта. Например для предметов, книг или программных продуктов появлялась ссылка на какой нибудь инетмагазин (Купить), для компаний — ссылка их годовые отчеты и биржевые котировки и т.д. Каждый пункт меню работал как гиперсылка на какой-то (разные) сайт, где была соотв. информация. Очень удобно.

Как это работало. Программа представляла нечто вроде плагина. При открытии страницы (документа…) она лезла в инет в какие-то базы данных (возможно свои, не разбирался). Получала списки известных ей фраз и ссылок… По клику формировала гиперссылку и отправляла на нее. Т.е. чисто внешнее автономное средство. Работает для любых сайтов и просто текстов. Не грузит сервера и т.д.

Проблемы Понимает она только слова, которые понимает. Понимает только английский. Если делать нечто подобное для русского языка сразу возникнут проблемы с падежами и склонениями.

YuriMakarov Нечто похожее можно сделать ничего не меняя на сайте, просто добавив JavaScript к странице, который по клику (или еще как) преобразовывал бы слова или фразы в запрос к поисковику.

* /Ку Ме: Да, да. Такая идея, как аналог сервиса ORFO уже мелькала.

AlekseyKulakov Понятно что это можно сделать. не понятно зачем это нужно…
Материалы по теме: http://spectator.ru/issues/319

— /Roman Ivanov

ВадимБарсуков: За материалы — спасибо. Зачем нужно — чуть ниже, а пока…
Ещё немного гипер-бреда…

* В классическом гипертексте мы (в роли Автора гипертекста) пытаемся «вручную» построить связи («ассоциации») между некими смысловыми фрагментами текста и на их «интерференции» построить для себя и для Читателя новый смысл (знание, эмоциональную оценку, информацию для дальнейшей деятельности в реале).
* Из-за неумения автоматически выделять смысловые фрагменты быстро, малозатратно и однозначно, нам приходится довольствоваться их приблизительным эквивалентом — словами/словосочетаниями. Если б умели хорошо работать с «кусками смысла», то в приведенной мною выше модели нужно было бы заменить эрзац «слова/словосочетания» на полноценные «смысловые фрагменты». И стало бы совсем хорошо: от перепрыгивания по словам перешли бы к «свободному ассоциированию» — от смысла к смыслу (почти классический психоанализ с его «методом свободных ассоциаций» как техникой проявления неосознаваемого психического материала).
* Супергипертекст(-медиа) [ :-) ещё точнее было бы назвать это «тотальным гипертекстом»] не устраняет, а позволяет дополнить авторские связи (ассоциации), дополнить логику автора гипертекста. Это дает нам, читателям гипертекста, возможность произвольно связывать, ассоциировать между собой предоставленные им (автором) смысловые фрагменты и на их пересечении порождать новые идеи.

Обычно ведь гипертекстовую разметку производит Автор текста. Он не знает (и не может знать достоверно, только «догадывается», предполагает), есть ли в Сети информация, ассоциированная по смыслу с фрагментами его собственного текста, какая она и насколько связана с его текстом. А вот searchengine «знает» это. Уже сейчас есть даже реальный прототип численной (количественной) оценки качества этой смысловой связи — «загадочный» коэффициент Page Rank поисковых систем.
В Yandex'е, например, с использованием этого коэффициента определяются CY (индекс цитирования), а также «похожие страницы», на которые в результатах поиска выдается ссылка «Показать похожие страницы». Ну, а здесь мы пытаемся получить «соотносящиеся по смыслу» куски текста и связать их между собой гиперссылками.

* Т.о. с появлением развитых поисковых систем и достаточно мощных клиентов (браузеров) у нас практически есть всё, чтобы проводить автоматическую гипертекстовую разметку. Конечно, может существенно измениться форма представления текста. Придется подумать над способами визуализации фрагментов с различной смысловой нагрузкой и степенью связности (изменение цвета текста? шрифт? фон? пиктограммы?). Можно, например, просто установить некоторое пороговое значение «коэффициента связности», при превышении которого фрагмент текста становится ссылкой в привычном нам сейчас виде (или помечается как «значимый», имеющий много смысла).

Надо отметить также, что гипертекстовая разметка будет тогда динамической, она будет меняться в зависимости от «жизни» Сети (появились или пропали новые ресурсы на какую-то тему — появились или пропали ссылки в тексте).

Зачем это нужно? А зачем нужен вообще гипертекст?
* Что до практической значимости, то кто в начале 90-х мог в деталях предвидеть нынешнюю «гипертекстовую революцию» и холодильники, заказывающие продукты для ужина через Интернет?

В чем-то этот «тотальный гипертекст» близок к концепции «поисковых агентов»: постоянный поиск информации на заданную тематику. В том же Яндексе есть подобный сервис— «подписка на запросы». А здесь сам текст «сообщает» читателю о наличии дополнительной информации по теме и «подсказывает» путь к ней.

* Собственно, для построения гипер-wiki есть уже компоненты: имеется ведь «поиск по базе», только нужно будет производить, так сказать, «упреждающие запросы» (см. выше). Такая wiki будет не просто угадывать ссылку из своего «пространства имён» (как етто есть по-руски — Name Space — я ничего не переврал?), но и «угодливо» предлагать тексты из своего «пространства смысла».


powered by CACKLE