Re: [gnome-cyr] web archive



On Fri, 16 Nov 2001, Timur I. Bakeyev wrote:

> On Fri, Nov 16, 2001 at 07:11:53PM +0400, Vlad Harchev wrote:
> > On Fri, 16 Nov 2001, Timur I. Bakeyev wrote:
> > > Я собираюсь на выходных написать некий прототип mail archiver'а, который пони-
> > > мает MIME как полагается...
> > 
> >  IMHO логичнее было бы пофиксить hypermail и тот который на gnome.org, чем
> > писать что-то с нуля.
> 
> Hypermail я давно смотрел, но там были какие-то идеологические сложности, а 
> MHonArc я ковырял совсем недавно - его дизайн не назовешь прямолинейным...
> На результат можно посмотреть на http://www.gnome.org.ru/mail/ - по каким-то
> причинам автор MHonArc решил, что SGML представление кириллицы - это то, что
> всем понравится... К сожалению, это не так, его понимает только lynx :( -
> (спасибо Влад :) - а netscape и explorer не сечет...

 Хм, надо просто в MHonArc найти строку где происходит замена символа на named
character reference и вбить туда printf "&#%d;" (или просто убрать
кириллические символы типа в из таблиц подстановок - тогда он сам будет
вынужден использовать "&#%d;" формат для символов). Короче, работы на 2
минуты. Он на чем писан?
 
> В общем, чем мучатся - проще самому написать :)
> 
> > > В связи с этм есть вопрос - никто не знает реализаций автоматического опреде-
> > > ления кодировки? Желательно на Perl'e..
> >  
> >  Вроде все используют частотный анализ. Так что написать будет легко.
> > Конкретных реализаций не знаю.
> 
> Проблема скорее в словаре - хороший частотный словарь довольно долго строить,
> да и исключения существуют...
> 
> В общем хотелось где-нибудь позаимствовать :)

 Ну я бы поискал в yandex.ru автодетектор кодировки - может есть что с
сырцами. Из них и выдрать таблицы. И по-моему в мозилле есть автодетект
кодировки - тогда таблицы частот можно найти в ее сырцах.

 Best regards,
  -Vlad




[Date Prev][Date Next]   [Thread Prev][Thread Next]   [Thread Index] [Date Index] [Author Index]