Re: [gnome-cyr] web archive
- From: Vlad Harchev <hvv hippo ru>
- To: gnome-cyr gnome org
- Subject: Re: [gnome-cyr] web archive
- Date: Fri, 16 Nov 2001 21:46:52 +0400 (SAMT)
On Fri, 16 Nov 2001, Timur I. Bakeyev wrote:
> On Fri, Nov 16, 2001 at 07:11:53PM +0400, Vlad Harchev wrote:
> > On Fri, 16 Nov 2001, Timur I. Bakeyev wrote:
> > > Я собираюсь на выходных написать некий прототип mail archiver'а, который пони-
> > > мает MIME как полагается...
> >
> > IMHO логичнее было бы пофиксить hypermail и тот который на gnome.org, чем
> > писать что-то с нуля.
>
> Hypermail я давно смотрел, но там были какие-то идеологические сложности, а
> MHonArc я ковырял совсем недавно - его дизайн не назовешь прямолинейным...
> На результат можно посмотреть на http://www.gnome.org.ru/mail/ - по каким-то
> причинам автор MHonArc решил, что SGML представление кириллицы - это то, что
> всем понравится... К сожалению, это не так, его понимает только lynx :( -
> (спасибо Влад :) - а netscape и explorer не сечет...
Хм, надо просто в MHonArc найти строку где происходит замена символа на named
character reference и вбить туда printf "&#%d;" (или просто убрать
кириллические символы типа в из таблиц подстановок - тогда он сам будет
вынужден использовать "&#%d;" формат для символов). Короче, работы на 2
минуты. Он на чем писан?
> В общем, чем мучатся - проще самому написать :)
>
> > > В связи с этм есть вопрос - никто не знает реализаций автоматического опреде-
> > > ления кодировки? Желательно на Perl'e..
> >
> > Вроде все используют частотный анализ. Так что написать будет легко.
> > Конкретных реализаций не знаю.
>
> Проблема скорее в словаре - хороший частотный словарь довольно долго строить,
> да и исключения существуют...
>
> В общем хотелось где-нибудь позаимствовать :)
Ну я бы поискал в yandex.ru автодетектор кодировки - может есть что с
сырцами. Из них и выдрать таблицы. И по-моему в мозилле есть автодетект
кодировки - тогда таблицы частот можно найти в ее сырцах.
Best regards,
-Vlad
[
Date Prev][
Date Next] [
Thread Prev][
Thread Next]
[
Thread Index]
[
Date Index]
[
Author Index]