La cuestión de género en la Web Semántica

La informática no es cosa de hombres. Comunicación para el congreso de Periodismo, mujer y comunicación 2015

Clase Person en el vocabulario FOAF. Se observa que no tiene sexo ni género dominio de.

Mientras realizaba mi trabajo de tesis “Tecnologías de la Web Semántica”, donde me acerco a su definición desde la herramienta del mapa conceptual de (algunas) tecnologías precedentes que propician su desarrollo y extensión, abordaba, por su importancia y relevancia, la cuestión de género. ¿Se aborda en la Web Semántica? Y si se hace, ¿de qué manera?

Qué participación han realizado las mujeres y cómo han respondido a los roles de género de la sociedad –capitalista– donde desarrollaron su trabajo, qué propuestas tecnológicas han propiciado, qué papel han podido ocupar con respecto al otro género, cuál ha sido su participación y qué representaciones se producen a consecuencia de su participación o su ausencia en la Web Semántica.

Esto es tan solo un boceto de la investigación incompleta al respecto.

El hilo de Corinna Bath

Siguiendo el hilo de las investigaciones difundidas por Corinna Bath y de las cuestiones planteadas por Sadie Plant en “Ceros y unos” reviso algunos hitos de la historia de la informática, la Web, las redes, el software o el hardware, para ver cómo se representa el género, algo que depende de un estado consciente y experiencial pero también de la capacidad o poder para ejecutarlo.

Uno de los mecanismos que identifica Corinna Bath es el denominado I-methodology:

the implicit assumption made by computer scientists and software developers that users of the technologies they design would share their own interests, preferences, competencies and abilities.

Several case studies (e.g. on smart houses, digital cities) have already shown that this assumption can completely fail, because the whole mindset of the designers is actually a specific one of a predominantly male homosocial group. Consequently, it tends to exclude certain groups of users or it takes them more effort to adapt to the technology. Enlace a archive.org

La cuestión sobre el diseño parece evidente pero, ¿qué hay del significado? Si las tecnologías semánticas permiten a los ordenadores a entender el significado de las cosas, ¿qué significado es el que se producen para las tecnologías semánticas? Por un lado, recogiendo lo anterior, el que lxs desarrolladorxs ontológicxs diseñan y producen. En este sentido, los estereotipos de género pueden aparecer con facilidad y si se “tratan” es probable que sea reforzando la ideología “binarista” (diferencias entre hombres y mujeres), cuando hay más diferencias como las de clase o etnia. Además, según cierta epistemología feminista que cuestiona el conocimiento tradicional se sustenta que “no existe el significado real” sino que el significado de las cosas siempre está “históricamente situado” (Haraway, Plant). Un solo significado traslada –o suele trasladar– la idea hegemónica del significado de las cosas. Alternativamente se puede optar por un pluralismo epistemológico que se aplique en el diseño.

Alan Turing, después de haber desencriptado durante la II Guerra Mundial los códigos nazis con la máquina “Enigma” en Bletchey Park, ayudado por miles de mujeres 1, crea en 1950, mientras trabajaba en la Universidad de Manchester en un nuevo ordenador, el test que lleva su nombre, la prueba de Turing 2. Pretende medir la inteligencia de una máquina a través de un juego que denominó “imitation game” (juego de imitación) en el que participan tres jugadorxs

  1. A, un hombre
  2. B, una mujer
  3. C, una persona de cualquier sexo que es la que hace las preguntas.

En este juego, C permanece en una habitación aparte y tiene que determinar cuál de lxs otros dos es la mujer y cuál es el hombre. Lxs conoce como X e Y por lo que al final del juego dice: X es A e Y es B, o viceversa. Para que no escuche su voz, las respuestas son por escrito, mecanografiadas. Ambxs pueden dar respuestas ambiguas, mentir o declarar lo que son o lo que no son para confundir. La pregunta que se hace Turing es, ¿se equivocará tanto el interrogador cuando A sea una máquina? ¿Puede “pretender” ser una persona? Es decir, “can machines think?”.

By Juan Alberto Sánchez Margallo - https://commons.wikimedia.org/wiki/File:Test_de_Turing.jpg, CC BY 2.5, https://commons.wikimedia.org/w/index.php?curid=57298943
Figure 1: By Juan Alberto Sánchez Margallo - , CC BY 2.5, https://commons.wikimedia.org/w/index.php?curid=57298943

El hecho de contemplar que A y B sean un hombre o una mujer no resultaría extraordinario de no ser porque no se suele considerar a la mujer como parte del imaginario del que nace la informática pese a que ha habido casos muy trascendentes.

En otro caso de inteligencia artificial, 50 años después de Turing, Dan Brickley y Libby Miller determinaban que el vocabulario FOAF albergara la propiedad foaf:gender para referirse al “género del agente, normalmente masculino o femenino, aunque no necesariamente”. Es decir, que por un lado una persona (clase foaf:Person) se encuentra en el dominio de la clase foaf:Agent, siendo foaf:Person una subclase de foaf:Agent. Y por otro, era una propiedad en “pruebas” o con estatus testing.

La clase foaf:Agent, con estatus estable, podía ser una persona, un grupo, un software u otro tipo de artefacto físico. Entre sus características, que siguen siendo las mismas, destacaban:

  • No lo consideraban una propiedad estática: el mismo individuo (instancia de la clase persona, subclase de agente) puede tener valores distintos en distintas fechas.
  • No estaba definido ni biológica ni anatómicamente aunque reconocen que la noción de género se aplica culturalmente incluso a robots como Bender (Futurama).
  • Esta noción de género no encajaba en ningún concepto asociado con el género, la biología o la sexualidad. Pretendían un equilibrio entre lo clínico y lo sociológico/psicológico.
  • Intentaban respetar la diversidad sin atentar con catalogar o enumerar la diversidad, de ahí lo de utilizar “literales” para el valor.
  • Finalmente, animaban a que se produjera un debate al respecto en su lista de correo en este sentido.

Además, reconocen la posibilidad de que los documentos (datos) que usen esta propiedad pueden no ser precisos o falsear la información ya que, “como cualquier medio de comunicación, admite la mentira”. Es por ello que alertan a quienes lo usen con datos de terceros que sean cautos al describir a otras personas con información no verificada y sensibles con difundir el sexo o el género, más allá de lo que concierne a los datos privados y personales. Es por ello que sugieren que sean lxs propixs usuarixs quienes se describan opcionalmente y que si lo hacen permitan más valores que “varón” o “mujer”.

Esta laxitud, indeterminación o estado de pruebas de la propiedad “género” en FOAF tuvo consecuencias inmediatas. Por ejemplo, los datos semánticos producidos a partir de los documentos de la Wikipedia, lo que hace el proyecto DBpedia, que reutilizan, entre otras, la ontología de FOAF, no tendrán “siempre” información del género de las entradas de personas que analizan ya que el propósito de FOAF se traslada, por arte de magia, a la DBpedia. Por tanto, tendría que haber un procesamiento posterior, bien fuera de “agentes humanos” o de “agentes máquinas” que discernieran entre el género de quienes aparecían en la Wikipedia 3. Y, por tanto, habría que reinterpretar los datos semánticos de la DBpedia o bien contar con una intervención de las personas sobre las que trataba su propia información, lo cual choca con el principio de no creación propia de Wikipedia..

Property
foaf:gender
Description
gender - The gender of this Agent (typically but not necessarily ‘male’ or ‘female’).
Status
testing
Domain
foaf:Agent
Range
http://www.w3.org/2000/01/rdf-schema#Literal

The foaf:gender property relates a foaf:Agent (typically a foaf:Person) to a string representing its gender. In most cases the value will be the string ‘female’ or ‘male’ (in lowercase without surrounding quotes or spaces). Like all FOAF properties, there is in general no requirement to use foaf:gender in any particular document or description. Values other than ‘male’ and ‘female’ may be used, but are not enumerated here. The foaf:gender mechanism is not intended to capture the full variety of biological, social and sexual concepts associated with the word ‘gender’.

Anything that has a foaf:gender property will be some kind of foaf:Agent. However there are kinds of foaf:Agent to which the concept of gender isn’t applicable (eg. a foaf:Group). FOAF does not currently include a class corresponding directly to “the type of thing that has a gender”. At any point in time, a foaf:Agent has at most one value for foaf:gender. FOAF does not treat foaf:gender as a static property; the same individual may have different values for this property at different times.

Note that FOAF’s notion of gender isn’t defined biologically or anatomically - this would be tricky since we have a broad notion that applies to all foaf:Agents (including robots - eg. Bender from Futurama is ‘male’). As stressed above, FOAF’s notion of gender doesn’t attempt to encompass the full range of concepts associated with human gender, biology and sexuality. As such it is a (perhaps awkward) compromise between the clinical and the social/psychological. In general, a person will be the best authority on their foaf:gender. Feedback on this design is particularly welcome (via the FOAF mailing list, rdfweb-dev). We have tried to be respectful of diversity without attempting to catalogue or enumerate that diversity.

This may also be a good point for a periodic reminder: as with all FOAF properties, documents that use ‘foaf:gender’ will on occassion be innacurate, misleading or outright false. FOAF, like all open means of communication, supports lying. Application authors using FOAF data should always be cautious in their presentation of unverified information, but be particularly sensitive to issues and risks surrounding sex and gender (including privacy and personal safety concerns). Designers of FOAF-based user interfaces should be careful to allow users to omit foaf:gender when describing themselves and others, and to allow at least for values other than ‘male’ and ‘female’ as options. Users of information conveyed via FOAF (as via information conveyed through mobile phone text messages, email, Internet chat, HTML pages etc.) should be skeptical of unverified information. http://xmlns.com/foaf/0.1/#term_gender

Sin embargo, el proyecto Wikidata, nacido en 2012 para aportar información semántica a los artículos de la Wikipedia, cuenta con dos términos (clases) para describir el “género” o “sexo”.

En el de “género cómo sexo”, sexo o género ((Q18382802), se describe como una “categorización de muchos organismos en varios grupos por características de sexo o género”. Sus declaraciones son:

Por su parte, esta parte “género” es la clase gender o Q48227, el “conjunto de características físicas, mentales y de comportamiento que distinguen entre masculinidad y feminidad”. Sus declaraciones son:

Como dice Kingsley Uyi Idehen, “DBpedia and Wikidata son extremadamente complementarios”. En términos de vocabularios semánticos, todo suma 4

Por su parte, vcard contemplaba esta propiedad desde 2011:

 1
 2
 3
 4
 5
 6
 7
 8
 9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
RFC 6350                          vCard                      August 2011


6.2.7.  GENDER

   Purpose:  To specify the components of the sex and gender identity of
      the object the vCard represents.

   Value type:  A single structured value with two components.  Each
      component has a single text value.

   Cardinality:  *1

   Special notes:  The components correspond, in sequence, to the sex
      (biological), and gender identity.  Each component is optional.

      Sex component:  A single letter.  M stands for "male", F stands
         for "female", O stands for "other", N stands for "none or not
         applicable", U stands for "unknown".

      Gender identity component:  Free-form text.

   ABNF:

                   GENDER-param = "VALUE=text" / any-param
                   GENDER-value = sex [";" text]

                   sex = "" / "M" / "F" / "O" / "N" / "U"

   Examples:

     GENDER:M
     GENDER:F
     GENDER:M;Fellow
     GENDER:F;grrrl
     GENDER:O;intersex
     GENDER:;it's complicated

Este RFC actualizaba los anteriores 4770 (vCard Extensions for Instant Messaging), 2426 (vCard MIME Directory Profile) y 2425 (MIME Content for Directory Information), sin presencia de la propiedad.

Estas cuestiones epistemológicas remiten al contexto de la Inteligencia Artificial en el que la Web Semántica entre en juego en cuanto a su posibilidad para automatizar la presentación, generación, almacenamiento y análisis de información compleja. Los metadatos y las ontologías ofrecen una apreciación del contexto en el que la tecnología se ha creado, con qué metodología pero también y sobre todo con qué ideología o conjunto de esquemas de pensamiento que responden a unos fines políticos, económico o sociales.

Las reflexiones de Corinna Bath y Sadie Plant se complementan. Plant aporta el sustrato del pensamiento situado de Haraway, con buenos ejemplos de las tecnologías de la información y del conocimiento, mientras que Bath se plantea cómo la ideología dominante permea, precisa o define las tecnologías y el uso que tenemos. Sin embargo, faltan ejemplos de lo segundo, y aquí es donde la investigación queda más incompleta.

Porque, aun siendo abrumador el número o porcentaje de tecnologías realizadas por el “hombre blanco occidental”, ¿es tan abrumador ese porcentaje que oculta toda participación de las mujeres? ¿Es más importante el porcentaje o la contribución neta y/o la contribución determinante? ¿Han operado siempre los roles de género con la misma lógica? ¿Cómo influye esa representación del conocimiento en otros desarrollos ontológicos, en las personas que los realizan, en quienes lo reutilizan, en quienes lo aplican o en quienes lo usan?

Volviendo al pensamiento situado, Haraway nos recuerda que la ciencia es uno de los productos culturales de la civilización occidental y, como tal, no puede ser analizada al margen de las relaciones de poder que le dieron origen. Por tanto, han influido los estereotipos de género en la división del trabajo, en las políticas de dominio y en las relaciones de poder implícitas. Se ha de conocer el contexto cultural y social del que parten el diseño y desarrollo de los conceptos tecnológicos. Sobre esto hay más conocimiento histórico y más estudios, pero no sobre lo anterior.

Pioneras

En los últimos años han trascendido varias figuras, todas importantes pero quizás la más determinante por ser la primera autora de una definición de un lenguaje de programación es Augusta Ada King (o Ada Lovelace si atiende al apellido de la familia de su madre antes de casarse o Ada Byron por cuando es hija del poeta inglés Lord Byron con quien estuvo casada su madre). Su caso es extraordinario pues al traducir un texto del científico italiano Luigi Federico Menabrea sobre la máquina analítica, un ordenador mecánico de propósito general, de su amigo y mentor Charles Babbage imaginó esta máquina no solo como capaz de calcular sino también de generar música, poesía, gráficos u otros usos prácticos o científicos. Son sus notas de la traducción, que triplican en extensión el contenido original, las consideradas el primer tratado de programación al incluir un algoritmo que debía correr en la máquina para calcular los números de Bernoulli.

Para reivindicar el papel de las mujeres en STEM (Science, Technology, Engineering and Mathematics, ciencia, tecnología, ingeniería y matemáticas) se celebra, todos los años, el segundo martes de octubre, el Ada Day.

Retrato de Ada Lovelace. Wikipedia.org
Figure 2: Retrato de Ada Lovelace. Wikipedia.org

En 1979, el Departamento de Defensa de EE.UU. de Norteamérica desarrolló un lenguaje de programación orientado a objetos, concurrente y fuertemente tipado. que llamó Ada en su honor. Se utiliza mucho en la aeronáutica, la gestión del tráfico aéreo y la industria aeroespacial.

Si Ada concibe el poder de esta máquina y lo representa, Grace Hopper empezó a trabajar con el ordenador Mark I, del ingeniero Howard Aiken, que desarrollaba el prototipo de la máquina analítica de Babbage. Hopper escribió su manual de uso donde se establecen los principios de programación. Además, en 1952 desarrolló el primer compilador, el A-0 para el Univac I, símbolos matemáticos (notación matemática) traducidos a código binario. Y continuó con el B-0 (Business Language version 0), el primer compilador con palabras, llamado posteriormente Flow-matic, que dio pie a COBOL (/COmmon Business-Oriented Language, lenguaje común orientado a los negocios).

El informe COBOL 60 para CODASYL (abril 1960)
Figure 3: El informe COBOL 60 para CODASYL (abril 1960)

También popularizó el término bug (insecto) para referirse a un error informático, ya que encontró un insecto en un relé de su ordenador Harvard Mark II que le hizo cometer un fallo.

Pero antes que Grace Hopper fueron Kathleen Antonelli, Betty Holberton, Ruth Teitelbaum, Frances Spence, Marlyn Meltzer y Jean Jennings Bartik las que se hicieron famosas por ser las “operadoras” del primer ENIAC en 1945 que dieron continuidad a sus carreras en proyectos relacionados. Antonelli pasó del cálculo de las trayectorias de los misiles al ENIAC. Jean Sammet participó con Hopper en el desarrollo de COBOL y desarrolla el lenguaje FORMAC (FOrmula MAnipulation Compiler, compilador de manipulación de fórmulas) en IBM que es considerado el primer lenguaje de programación que interpreta símbolos algebraicos y los traduce en código. Ida Rhodes diseño el lenguaje C-10 para el UNIVAC I que se utilizó para calcular el censo de EE.UU. Holberton pasó por ENIAC, COBOL, UNIVAC y también a BINAC (Binary Automatic Computer), primer ordenador con programa almacenado en EE.UU. Allen Wilkes escribe desde el MIT el sistema operativo para LINC (Laboratory INstrument Computer, ordenador instrumento de laboratorio) en 1961, primer sistema operativo que se sitúa entre el programa y el hardware. Desarrolla el modelo de ensamblador-enlazador que se usa en compilación de programas

Toda esta informática para empresas comienza a desarrollarse para el gran público a partir de los años 1960’. Es Allen Wilkes quien trabaja de 1959 a 1963 en el Laboratorio Lincoln del MIT donde trabaja para LINC, primer ordenador de tamaño doméstico. En 1965 construye su propio ordenador y es considerada la primera usuaria de un ordenador doméstico.

Hasta que no desarrollaron estos lenguajes de programación para relacionarse de forma más sencilla con el ordenador y estas nuevas máquinas muchos hombres no se habían interesado por el software y se habían centrado más en el diseño y construcción de hardware.

Mary Allen Wilkes en casa, 1965
Figure 4: Mary Allen Wilkes en casa, 1965

También en redes de comunicaciones han contribuido de manera extraordinaria. Hedy Lamar (1914-2000) sentó las bases para las tecnologías inalámbricas como WiFi, GPS o Bluetooth. Inventó junto con el músico George Antheil el sistema del espectro ensanchado que se basaba en saltos de frecuencia de radio para la transmisión de mensajes entre emisor y receptor. Se conseguía prevenir la interceptación de las señales de radio, por ejemplo, en la trayectoria de un torpedo hacia su objetivo. Aunque la Marina de los EE.UU. lo descartaron en su momento, lo utilizaron una vez había caducado la patente.

En el mundo de Internet han confluido muchas tecnologías pero hay una tan importante que a su inventora se le denomina la “madre” de Internet. Se trata de Radia Perlman, inventora en 1985 del algoritmo del árbol de expansión STP (Spanning-Tree Protocol/), fundamental para los puentes o enlaces entre redes.

La cibernética supuso una revolución para las identidades de género, expresado en el término redundante cyborg, contracción de cybernetic organism u organismo cibernético, pues todos los organismos ya son comprendidos por la cibernética. Acuñado en 1960 por Manfred E. Clynes y Nathan S. Kline, se referían a un ser humano mejorado que pudiera vivir en entornos extraterrestres ante la posibilidad de que la carrera espacial obligara al humano a habitar en otros planetas. Lo interesante para las teorías feministas o ciberfeministas es que un/a cyborg no es ni hombre ni mujer en el sentido de género ni de sexo, es decir, que no tenían ni sexo ni género definido. Esta nueva identidad cyborg podía romper con la cultura de las mujeres sumisas y esclavas, sometidas al hombre, con el binarismo, con la determinación de género.

Conclusiones (apuntes)

Las mujeres han sido pioneras, han tenido un papel protagonista o determinante en muchos hitos de la historia de la informática. Sin embargo, la consideración actual es que la informática es algo “de hombres” y además los números refuerzan esa idea ya que se matriculan menos mujeres en carreras STEM, hay menos investigadoras y forman una minoría del ámbito laboral.

Las campañas de la UNESCO abogan por fomentar la igualdad de oportunidades para las actuales y próximas generaciones. Se ha de señalar que no se debe abordar el asunto desde el punto de partida de que la participación de las mujeres en las tecnologías no ha ocurrido o “se han ausentado” y ahora tienen la oportunidad de hacerlo. Al contrario, siempre han sido parte y solo unas relaciones sociales de trabajo y poder han determinado una mayor o menor participación. Algunas iniciativas como Ada Day (se celebra el segundo martes de octubre) o el “Grace Hopper Celebration of Women in Computing” denominado Open Source Day (se celebra en septiembre) o el Día de las Mujeres y las Niñas en la Ciencia, el 11 de febrero, abogan por este enfoque.

En lo que respecta a cómo la Web ha revolucionado la epistemología por cuanto supone la Web Semántica una posibilidad para la automatización del procesamiento de información, la creación de contenido recombinado o el almacenamiento de contenido, no conozco análisis que aborden los contextos, fines, metodologías o resultados de los proyectos desarrollados. Por tanto, esto es una tarea que todavía está por hacer.

Tampoco habría que dejar de mencionar el gran desarrollo en los últimos años de las técnicas de aprendizaje automático que está provocando algunos hechos extraños en distintos ámbitos de la sociedad que tienen que ver también por cómo se establecen perfiles o denominaciones con los sesgos ideológicos de quienes los producen.

To be continued


  1. 8000 mujeres trabajaron en Bletchley Park, el cuartel para el criptoanálisis durante la II Guerra Mundial, con un total de 10.000 trabajadorxx. https://en.wikipedia.org/wiki/Women_in_Bletchley_Park ↩︎

  2. Su ensayo se llama “Computer Machinery and Intelligence” https://es.wikipedia.org/wiki/Computing_machinery_and_intelligence ↩︎

  3. Esta situación ha cambiado desde Wikidata al menos. ↩︎

  4. DBpedia y Wikidata se complementan: https://meta.wikimedia.org/wiki/Wikidata/Notes/DBpedia_and_Wikidata ↩︎

Adolfo Antón Bravo
Adolfo Antón Bravo
Coordinador del Máster de Periodismo y Visualización de Datos de la Universidad de Alcalá

Periodismo y visualización de datos, web semántica, bash, emacs, orgmode

Relacionado