Re: [gnome-hispano] =?utf-8?q?Redefiniendo_el_paradigma_de_b=C3=BAsqu?= =?utf-8?q?eda_y_gesti=C3=B3n_de_informaci=C3=B3n_en_Nautilus?=



El Tue, 21 Jul 2009 03:07:19 +0200
TomÃs VÃrseda <kaskaras gmail com> escribiÃ:

Saludos a Domingo y a toda la lista.

Hola TomÃs, saludos y gracias por tu interesante contribuciÃn. Respondo entre lÃneas:


No recuerdo si alguna vez me presentà al darme de alta y si lo hice fue ya
hace mucho tiempo. Y ya que un programa mÃo sale a colaciÃn aprovecho para
presentarme entre los gnomeros hispanos.

Me llamo TomÃs y soy autor de Vazaar, uso GNOME como escritorio por defecto
y en los ratos libres me gusta dedicarme a leer, entre otras cosas, todo lo
que està relacionados con la Web SemÃntica e intentar desarrollar la que
està siendo la aplicaciÃn de mi vida: Vazaar. Ya llevo casi 6 aÃos en ello y
todavÃa continuo dÃndole vueltas a muchos temas. LÃstima que no le pueda
dedicar todo el tiempo que deseara.

No quiero dar mÃs publicidad de la que se le debe a mi programa pero para
estar mÃs actualizados estoy centrando el desarrollo [1] en launchpad y mis
anotaciones [2] en este blog y en el wiki [3].

Entonces llevas ya un tiempo "peleando" con este tema...


Dicho esto, respondo a tu correo entre lÃneas:

El 20 de julio de 2009 17:53, Domingo Gonzalez <gonav ono com> escribiÃ:

Hola,

Debajo de este nombre tan espectacular subyace una idea tonta que se me ha
ocurrido a raÃz de intentar reorganizar y actualizar toda la informaciÃn del
disco. Seguro que a estas alturas esto està ya planteado y/o resuelto, pero
no he encontrado demasiadas referencias al respecto. Bien, la problemÃtica a
resolver serÃa la siguiente:



No tan tonta idea. Yo llevo con este problema desde hace muchos aÃos.


- Cada x tiempo, tenemos la costumbre de reorganizar nuestros ficheros, bien
porque no nos gusta la estructura anterior, bien porque lo que antes era un
cajÃn desastre con cien ficheros, ahora son varias categorÃas bien definidas
y con muchÃsima mÃs informaciÃn. Reorganizar la estructura fÃsica de
ficheros es un trabajo arduo.



Como he leÃdo en otros correos, el porno es un buen ejemplo para pensar en
como clasificar informaciÃn pero la realidad es que el abanico de ejemplos
es mÃs amplio :) Principalmente, y entre otras cosas, a mi me preocupaba
saber que hacer con todos esos ficheros esparcidos por infinitos directorios
repletos de informaciÃn (manuales, cursos, informaciÃn sobre trabajos,
cÃdigo fuente, ...).

Exacto. Por ejemplo en mi caso particular estamos hablando de, por una parte, los ficheros personales que 
contienen informaciÃn de todo tipo y de todo formato (los htnl mÃltiples son terribles para la gestiÃn), y 
por otra parte todos los ficheros en el servidor de trabajo. Aunque una parte de los datos (trabajo) estÃn 
organizados necesariamente en forma de Ãrbol y con una estructura definida, el resto de informaciÃn se 
organiza como se puede. El principal problema està en aquella cuya organizaciÃn no està clara desde un 
principio. Por ejemplo el par de gigas sobre programaciÃn que tengo (pdf, html, cÃdigo, etc), despuÃs de 
varios aÃos reorganizÃndolos, siguen igual de "desordenados" y resulta igual de complicado hacer una bÃsqueda 
eficiente. No he avanzado en nada.

Otro tema importante es la consecuencia de mover fÃsicamente cantidades ingentes de informaciÃn de cara a las 
siguientes copias de seguridad incrementales. 




- Dentro de un directorio en particular tenemos numerosos ficheros, los
cuales estÃn organizados como mejor hemos podido. Por ejemplo, supongamos un
directorio /prgtk con manuales sobre programaciÃn en gtk2.0. Dentro hay pdf
muy completos e interesantes, que tenemos como referencia obligada, y otros
con algÃn aspecto puntual sin interÃs actual (quiÃn sabe en un futuro) y que
guardamos en /otros. AdemÃs, puede que tengamos el mismo fichero en pdf y en
html, lo cual implica otra carpeta adicional con su subestructura de
ficheros, que complica la bÃsqueda del index.html por ejemplo. En el fondo
estamos intentando clasificar las caracterÃsticas de cada fichero por la
estructura fÃsica de directorios y no por metadatos, labor que considero
infructuosa y temporal.


- En una estructura de miles de directorios y subdirectorios, recordar en
cada momento dÃnde està cada cosa es poco menos que imposible.



Efectivamente la actual organizaciÃn jerÃrquica no es lo indicado para
buscar ni organizar informaciÃn. Al menos no toda. Es efectiva para
organizar cÃdigo fuente e informaciÃn que use Ãrboles. Para todos esos
ficheros que te descargas, emails que recibes, contactos de tu agenda,
pensamientos, notas, enlaces a la web, mÃsica, fotografÃas, vÃdeos, etc. es
necesario otro tipo de planteamiento. Yo empecà con el mÃs simple, el 2.0,
las tags. Hasta las version 0.3 mantuve esa visiÃn pero es un callejÃn sin
salida. Las tags no significan nada, no tienen significado por si mismas.
Para comprender, tanto la mÃquina como yo, de que estamos hablando
necesitaba un modelo por debajo. Buscando y buscando me topà con la Web
SemÃntica con sus ontologÃas y sus vocabularios.

TambiÃn creo que es necesario buscar otro enfoque radicalmente opuesto. La Web semÃntica puede ser la 
soluciÃn, aunque el tiempo lo dirÃ.




- Los nombres de los ficheros no son lo suficientemente largos ni
descriptivos como para poder saber muchas veces quà hay dentro del mismo. Se
necesita informaciÃn adicional sobre el fichero/directorio para que la
bÃsqueda sea mÃs prÃctica. Y no hace falta decir el trabajo necesario para
renombrar todos los ficheros del tipo tut_pygtk_v1.0.pdf a nombres mÃs
"sociables". El sistema de notas y emblemas que integra nautilus es un
principio, pero me gustarÃa ir mÃs allÃ.



ÂQuà sistema propongo? Lo ideal serÃa una implementaciÃn con al menos las
siguientes caracterÃsticas:

- SeparaciÃn entre la estructura organizativa de la informaciÃn y la
estructura fÃsica de ficheros.


A esa conclusiÃn lleguà yo. Considero dos capÃs:
- la fÃsica: la cual mantiene los ficheros/datos en un repositorio
- la lÃgica: por cada objeto almaceno en una base de datos todas sus
propiedades (metadatos). Y cada objeto pertenece a una clase. Para ello me
he ayudado de los conceptos de la web semÃntica. e El proyecto Nepomuk[4]
trata de traer la web semÃntica al escritorio. KDE ya lo està implementando
a travÃs del proyecto Soprano[5], una capa entre las aplicaciones y la bbdd
semÃntica. Me gustarÃa que GNOME Y KDE fueran de la mano en este aspecto.
Creo que serÃa un salto de gigante en los escritorios.

Algo asà es lo que echo de menos en los escritorios. QuizÃs estemos en el buen camino, pero todavÃa nos queda 
mucho camino por delante.



- Manejo de la informaciÃn como objetos y no como ficheros (por ej. un
manual en html multi-pÃgina serÃa un solo objeto)



Pues asà como lo consideraste tÃ, lo hice yo.  De alguna manera habÃa que
describir quà era quÃ.


- Posibilidad de asignar y visualizar informaciÃn adicional fÃcilmente a un
determinado fichero (objeto), como metadatos.



Una base de datos semÃntica està formada por miles de triples (sujeto,
predicado, objeto) los cuales pueden ser consultarse con SPARQL, un lenguaje
de consulta bastante potente al estilo de SQL para realizar operaciones de
inserciÃn, ediciÃn y borrado. La visualizaciÃn es un tema bastante complejo.
El cÃmo representar los datos queda a manos del desarrollador el cual no
suele ser el mÃs indicado para esos casos. Yo soy un caso y tengo tantas
ideas como problemas para implentar visualmente los datos. Echa un vistazo a
este post sobre el diseÃo de aplicaciones semÃnticas [6].

Interesante. He visto que usar SPARL en las nuevas versiones de Vazaar, lo probarÃ.


- FÃcil ediciÃn para organizar la estructura de la informaciÃn, pudiendo
crear secciones, subsecciones y enlazar tanto con direcciones url de
internet como con del tipo file:// de una manera cÃmoda.


Dado que hay cientos de ontologÃas y vocabularios elegÃ, espero que
acertadamente, el proyecto Nepomuk para realizar mi propio modelo. Permite
realizar anotaciones, referencias, contactos, descripciones de todo tipo de
datos como videos, fotos, mÃsica, cÃdigo fuente, posts, emails, ...



- Sistema de bÃsqueda por nombre real y por metadatos.


Yo considerarÃa tres: una simple al estilo google basada en palabra(s), una
guÃada donde tà construyes la pregunta y la avanzada que permitirÃa escribir
consultas complejas. Y posteriormente poder guardar esas bÃsquedas.

Buena idea, sobre todo lo de guardar las bÃsquedas. Creo que algunos clientes de correo ya lo hacen 
(thunderbird, y no sà si evolution).

 
Todo esto se podrÃa integrar en Nautilus de alguna forma. Algunas
implementaciones existentes que he estado mirando y que podrÃan aprovecharse
en mayor o menor medida son las siguientes:

- El sistema de metadatos (notas y emblemas) de Nautilus, mÃs ampliado.


Nautilus deberÃa rediseÃarse de cero o quedar relegado a ser una simple
aplicaciÃn de escritorio no apta para usuarios noveles. Nautilus deberÃa
refundarse en algo parecido a Soprano para que todas las aplicaciones puedan
acceder a tu base de conocimientos. Que no necesariamente tiene que ser todo
lo que haya en tu home. Tracker me parece una muy buena idea pero no me
vale. Escanea todo continuamente. Yo prefiero ir construyendo mi propia base
de conocimientos a medida que voy aÃadiendo objetos.

A eso iba, que si se quiere otorgar a Nautilus la labor de pieza central en la gestiÃn de la informaciÃn, 
deberÃa integrar todo el sistema de base de conocimientos. 





- Una plataforma wiki como herramienta mÃs flexible y eficiente para editar
la organizaciÃn de la informaciÃn. PermitirÃa de una forma muy sencilla
crear secciones, subsecciones, textos, comentarios y enlaces a direcciones
de internet y ficheros locales, mostrando toda la informaciÃn de los
metadatos para conocer sus caracterÃsticas de un vistazo. TambiÃn que
permita enlazar un directorio, dentro del cual navegarÃamos como ventana
normal del Nautilus. No serÃa muy descabellado integrar un wiki en Nautilus
como extensiÃn, estando moinmoin escrito en perl. Incluso hay una versiÃn
Desktop Edition [1] que trabaja en un directorio local de home. Definiendo
en moinmoin /home/Archivo como directorio de trabajo se podrÃa acceder a
todos los ficheros como locales al wiki, por dar una idea.


Creo que la mejor forma de exponer los datos serÃa creando SPARQL end-points
[7] para exponer recursos y servicios y a su vez ser consultados por otras
aplicaciones.


- El sistema de gestiÃn de colecciones de GNOME Vazaar [2], aunque me parece
mÃs flexible el wiki.


No pensaba que alguien todavÃa se acordarÃa de esa versiÃn. SÃ, cualquier
wiki supera a la desastrosa versiÃn 0.3 de ese infame programa. Espero que
la 0.4 sea mÃs acorde con lo que estoy exponiendo. Por suerte, he conocido
Python.

SÃ, Vazaar hace tiempo que lo conozco. Fue lo mÃs parecido a un sistema de gestiÃn de informaciÃn que pude 
encontrar, y hace muy bien su trabajo. Ahroa he visto que la nueva versiÃn da un salto cualitativo.

Ah, yo tambiÃn me estoy dejando seducir por el lado oscuro, tras mucho tiempo con C/C++ he caÃdo en brazos de 
python.



- El enfoque del entorno de trabajo de GnomeShell [3] y su nuevo paradigma
de gestiÃn de informaciÃn.


Hay varios trabajos en marcha, por aquà he leÃdo Zeitgeist, pero hay otros
proyectos que comparten el mismo objetivo: traer la Web SemÃntica al
Escritorio. Te darÃa una lista de ejemplos pero no tengo a mano sus urls.

Revisando todas las referencias que me han dado veo que hay muchÃsimos proyectos en marcha. Como dice Ismael, 
veremos cuÃl de ellos implementea el paradigma adecuado. 



Conste que soy poco amigo de las soluciones no tradicionales, pero reconozco
que un sistema de gestiÃn como este es mucho mÃs eficiente para un
escritorio que la navegaciÃn por directorios de toda la vida. En fin, no sÃ
si algo parecido està ya en marcha (quizÃs GnomeShell), pero como mÃnimo
vamos a generar un interesante debate.

Un saludo.

[1] http://moinmo.in/DesktopEdition
[2] http://www.kaskaras.net/vazaar/index.php
[3] http://live.gnome.org/GnomeShell/Screenshots



Lamento no tener mÃs conocimientos tÃcnicos para crear esa capa que ayude a
GNOME a dar el salto a algo mÃs humano y no tan cuadrao como es ahora. OjalÃ
sea una preferencia para una prÃxima versiÃn 3.0 de este escritorio. El
siglo XX ya lo dejamos a la vuelta de la esquina.

Hombre, tu experiencia en Vazaar te sitÃa en una muy buena posiciÃn para meterte en este tema...
Para GNOME 3 se està preparando un cambio de enfoque, pero desconozco hasta quà punto van a integrar sistemas 
de web semÃntica. Sea como sea, seguro que es un salto cualitativo.


Un saludo.


Saludos.


[1] https://launchpad.net/vazaar
[2] http://www.vazaar-project.org/blog
[3] http://www.vazaar-project.org/wiki <http://www.vazaar-project.org/blog>
[4] http://nepomuk.semanticdesktop.org/xwiki/bin/view/Main1/
[5] http://soprano.sourceforge.net/node/1
[6]
http://blog.semantic-web.at/2008/09/18/mockups-essential-semantic-applications-design/
[7] http://www.openlinksw.com/weblog/oerling/?id=1085



[Date Prev][Date Next]   [Thread Prev][Thread Next]   [Thread Index] [Date Index] [Author Index]