Re: [gnome-cyr] web archive
- From: "Timur I. Bakeyev" <timur com bat ru>
- To: gnome-cyr gnome org
- Subject: Re: [gnome-cyr] web archive
- Date: Fri, 16 Nov 2001 21:51:41 +0100
On Fri, Nov 16, 2001 at 09:46:52PM +0400, Vlad Harchev wrote:
> On Fri, 16 Nov 2001, Timur I. Bakeyev wrote:
> > На результат можно посмотреть на http://www.gnome.org.ru/mail/ - по каким-то
> > причинам автор MHonArc решил, что SGML представление кириллицы - это то, что
> > всем понравится... К сожалению, это не так, его понимает только lynx :( -
> > (спасибо Влад :) - а netscape и explorer не сечет...
>
> Хм, надо просто в MHonArc найти строку где происходит замена символа на named
> character reference и вбить туда printf "&#%d;" (или просто убрать
> кириллические символы типа в из таблиц подстановок - тогда он сам будет
> вынужден использовать "&#%d;" формат для символов). Короче, работы на 2
> минуты. Он на чем писан?
Писан он на Perl'e, и исправить по такому варианту не проблема, в частности,
поддержку koi8-r и cp1251 туда добавлял уже я, но сам по себе MHonArc меня
добил полным игнорированием идеологии Perl 5... Не знаю, может я и идеалист,
но так писать не стоит.. посмотрим, впрочем, что выйдет у меня :)
> >
> > Проблема скорее в словаре - хороший частотный словарь довольно долго строить,
> > да и исключения существуют...
> >
> > В общем хотелось где-нибудь позаимствовать :)
>
> Ну я бы поискал в yandex.ru автодетектор кодировки - может есть что с
> сырцами. Из них и выдрать таблицы. И по-моему в мозилле есть автодетект
> кодировки - тогда таблицы частот можно найти в ее сырцах.
Будем искать! (c)
:-)
С наилучшими прожеланиями,
Тимур Бакеев.
[
Date Prev][
Date Next] [
Thread Prev][
Thread Next]
[
Thread Index]
[
Date Index]
[
Author Index]