[gnome-hispano] Parser html-moin: apoyo para librognome



Hola,

Estaba mirando alguna herramienta para facilitar la migración de las
partes que faltan [1] del librognome en html al wiki, y me he
encontrado con el módulo HTML::WikiConverter de Perl.

Haciendo unos pequeños cambios al código del ejemplo que hay en CPAN,
he preparado este pequeño parser:

# parser-moin.pl
use HTML::WikiConverter;
$wc = new HTML::WikiConverter( dialect => 'MoinMoin' );
$ifile = "input.html";  
$ofile = "output.txt";
open(IN, "<$ifile") || die("No se puede abrir $ifile"); 
open(OUT, ">$ofile") || die("No se puede abrir $ofile"); 
$fhtml = <IN>; 
$fwiki = $wc->html2wiki( html => $fhtml );
print OUT $fwiki;
close(IN);
close(OUT);

Si tenemos pendiente pasar un html al wiki, por ejemplo este: 
http://es.gnome.org/Documentacion/Desarrollo/XmlEnGNOME

tenemos que eliminar primero la cabecera del html y los saltos de línea:
$ sed '1d' c10872.html | tr -d '\n' > input.html

y entonces parsear el fichero:
$ perl parser-moin.pl

En el fichero de salida output.txt tenemos el código moinmoin para
copiar directamente al wiki. 

He estado haciendo algunas pruebas y salvo algún pequeño retoque
posterior en el wiki, funciona razonablemente bien. Pienso que nos
podemos ahorrar algo de tiempo.

Si alguien se anima a probarlo... ;-)

[1] http://es.gnome.org/Documentacion/Desarrollo



[Date Prev][Date Next]   [Thread Prev][Thread Next]   [Thread Index] [Date Index] [Author Index]