martes, 22 de septiembre de 2015

¿Para cuando un software libre para análisis cualitativo de datos?

En 1997 presenté mi primer artículo sobre el software para análisis cualitativo de datos, tras haber comparado el uso de dBase III Plus y NUD*IST 3 para realizar análisis semiótico de enunciados.
En aquella época estaba muy satisfecho con las prestaciones del software de QSR, a pesar de lo que hoy considero como limitaciones.

Dícté numerosas capacitaciones de análisis cualitativo asistido por computadora mediante NUD*IST 3 y 4 y luego NVivo 1.3 (ambos de QSR). Hasta que apareció el Nvivo 7, la primera versión de este programa desde que QSR se convirtió en partner de Microsoft y ahí se pudrió todo.

El Nvivo adquirió todas las virtudes y defectos de los prorgamas de Microsoft: con la intención de volverlo más vistoso, fácil e intuitivo de usar se rediseñó toda la interfaz, que resultaba asombrosamente similar a la del Outlook, a la vez que se abandonó una de las mayores fortalezas que tenía el NUD*IST, su lenguaje de comandos. Yo hice un uso intenso de ese lenguaje y siempre lamenté su pérdida.

El NVivo 7 multiplicó varias veces su tamaño y sus requerimientos de sistema (memoria, procesador, requerimientos gráficos). Desde entonces usa Microsoft .NET y MicrosoftSQL Server, tiene numerosos bugs que provocan el cierre repentino del programa y comenzó a tener por cada versión varios service packs y hotfixes. Nunca antes los había tenido.

Nvivo 10, de QSR
Comenzaron a agregarse funciones y herramientas nuevas ("chiches")  para realizar diversos tipos de análisis cuantitativos, algo a mi juicio completamente inútil en un programa para análisis cualitativo. ¿Qué utilidad puede tener un análisis por conglomerados de textos que no provienen de una muestra estadísticamente representativa?

Cuando hice mi tesis usé Nvivo 10 y probé el uso del análisis de conglomerados, con resultados muy interesntes que confirmaban mis supuestos sobre la manera como se agruparían los documentos en función de su similitud. Así es que me interesé en saber en qué datos se basaba el programa para realizar los agrupamientos. Como esa información no figura en la ayuda del programa me contacté con el servicio técnico (lo mejor que tiene el NVivo es su servicio técnico) y logré que me enviaran un documento en el que se explica este procedimiento. Resultó ser que el programa agrupa los documentos basándose en la codificación de los mismos en todos los nodos. Lo cual es tramposo. Porque si el software encuentra similares dos documentos del mismo organismo estatal  no es porque su contenido, su estilo, su lexicografía sea semejante, sino porque ambos están codificados (por el investigador) en el nodo de caso correspondiente a dicho organismo. Esto es una petición de principio. Es como conlcuir que dos personas son parecidas sabiendo que son hermanos.

Otros inconvenientes del NVivo 7 en adelante son que es muy caro, usa la técnica de validación online de Windows (con lo cual se vuelve muy difícil de compartir) y además la licencia TIENE FECHA DE VENCIMIENTO!. O sea, vos comprás el programa, pero después de algo así como tres años se bloquea y si querés seguir usándolo tenés que volver a comprarlo, aunque la versión que tenés siga siendo la última. Esta práctica es legal pero injusta. De hecho, me parece mafiosa.

Todo esto lo vengo comunicando desde hace años a QSR cada vez que me invitan a participar de su encuesta anual de usuarios y de instructores independientes. Pero sus políticas no han cambiado en nada en este sentido. Al contrario. Se profundizan progresivamente.

Así es que he declarado BASTA y me he puesto en campaña para encontrar un software libre de análisis cualitativo. ¿Y saben qué? No hay ninguno que valga la pena. He revisado media docena y nada. ¿En qué me baso para afirmar esto? En los mismos criterios que expresé en mi ponencia de 1997: un buen software de análisis cualitativo tiene que
  1. poder trabajar con textos (preferentemente aceptando formatos binarios de procesadores de texto de uso extendido (como .doc, .rtf, odt) y pdf. 
  2. codificar dichos textos en categorías jerárquicas (conceptuales y demográficas o atributos)
  3. distinguir entre unidades de análisis (casos) y de observación (documentos)
  4. realizar búsquedas de texto verbatim y aproximadas (por similitud)
  5. recuperar lo codificado en una categoría o en una combinación de categorías usando operadores booleanos (and, or, not), o sea los cruces de categorías, incluyendo la elaboración de matrices cualitativas, producto del cruce de dos grupos de categorías (conceptuales o demográficas).
  6. codificar automáticamente los resultados de las búsquedas textuales tanto como de las consultas de lo codificado.
  7. Proporcionar diversos tipos de informes del estado actual del proyecto (libro de códigos, cantidad de texto y de documentos codificados en cada categoría, etc. y acceso al texto mismo)
Lo anterior es imprescindible para un análisis cualitativo básico, general, ya sea que se trabaje con enfoque de la Grounded Theory, hermenéutico, análisis cualitativo de contenido, análisis de discurso, etc. Luego deberían existir módulos optativos con funciones específicas para distintos tipos de análisis, por ej. para análisis cuantitativo de contenido pueden agregarse módulos de conteo de frecuencias de palabras y sus repectivos gráficos, como tiene el QDA Miner y el Nvivo, entre otros. Otros módulos para quienes deseen hacer análisis de redes discurso, o de redes semánticas, o análisis automático de discurso, para quienes necesitan procesar imágenes, video, audio, etc. De modo que cada usuario pueda elegir instalar o no, activar o no cada módulo, según sus necesidades y preferencias.

Para mi forma de trabajo un software que no elabore matrices cualitativas a partir del cruce de categorías no reúne los requisitos mínimos. Y lo que he encontrado en mi última búsqueda es que aún no existe un software libre para análisis cualitativo que realice esas funciones.

El AQUAD 7 tiene todas las complicaciones típicas de los programas GNU y tantos errores que termina resultando inoperante. El Open Code 4.2 es de tipo “code & retrieve”. Muy elegante y fácil de usar, pero no realiza ningún tipo de cruce de categorías. Lo mismo vale para el EdET y el QDA Miner Lite que es es gratis (freeware) pero no libre.

El Libre QDA parece muy auspicioso pero ni siquiera está en pañales. Aún no ha nacido. No existe ni una demo o una versión beta que se pueda probar . 

El Weft QDA dice que lo hace pero no funciona. Lo probé y los resultados de búsqueda son inconsistentes. Me mostraba sólo una parte de los resultados que debía mostrar. O sea, yo sabía que había más resultados pero el programa no los mostraba. Además la misma web del programa tiene esta advertencia del autor:
“IMPORTANTE: este software se ofrece sin ninguna garantía ni soporte. Algunas personas aún así podrían encontrarlo interesante e incluso útil, pero:
  • no es para proyectos importantes como una tesis doctoral.
  • La versión 1.0.1 contiene errores que pueden ocasionar la pérdida de datos en sus análisis o volver ilegible el archivo de proyecto.” (http://www.pressure.to/qda/)
Tengo noticias de la existencia de programas libres de análisis cualitativo que sólo corren en Linux, lo que puede ser interesante para los usuarios de Linux, que son una minoría y parece que lo seguirán siendo durante muchos años más. 

Una solución sería escribir mi propio software. Pero yo no soy programador ni tengo la intención de aprender a programar a esta altura de mi vida. Hoy día los dos programas comerciales más usados para esta finalidad, el Nvivo y el Atlas/ti tienen muchas más funciones que las básicas y tienen la contra de ser privativos, caros y (al menos el Nvivo) estar llenos de errores.  Por eso pregunto ¿para cuando un programador o grupo de programadores levantará el guante de producir un software a la altura de los comerciales en prestaciones pero que sea más sencillo y libre? Si aparece alguno cuenta con mi apoyo en lo que sí puedo ayudar, que no es ni apoyo financiero ni trabajo de programador, sino como usuario, investigador, académico y docente. ¿Algún interesado?