Acessibilidade / Reportar erro

"Coisas que as pessoas sabem": computação e territórios do senso comum

Resumos

A inteligência artificial constrói, através da computação, sistemas com capacidades especiais na medida em que são capazes de realizar tarefas elaboradas para as quais a inteligência humana seria, em princípio, essencial. Um desses sistemas, um projeto de longo prazo e larga escala conhecido como CYC, propõe-se a uma tarefa considerada muito difícil, que é a de representar e tornar utilizável computacionalmente o conhecimento de senso comum, isto é, conhecimento não especializado, de que as pessoas lançam mão no decorrer do dia a dia sem mesmo dar-se conta de que o estão utilizando. Para realizar este projeto, seus criadores partem de premissas não explicitadas, tais como a de que esse conhecimento é, em primeiro lugar, representável de alguma maneira formal. Examinaremos com atenção esse projeto, para tentar tornar visíveis algumas dessas premissas que consideramos importantes. Buscaremos mostrar, ademais, como o conhecimento ali expresso é marcado pela perspectiva dos seus criadores sobre o mundo e sobre o que se constitui como conhecimento válido.

Inteligência artificial; Senso comum; Pressupostos epistemológicos; Tecnologia e sociedade; Conhecimento


The discipline of artificial intelligence has been able to build computational systems with remarkable abilities concerning some difficult tasks for which a human intelligence would otherwise be required. One of those systems, a long term and large-scale enterprise known as CYC, aims to represent and to make usable by computational means the common sense knowledge. Common sense is, in this situation, non-expert knowledge of the world around us, of the type people put to use in their day-to-day affairs. The creators of CYC make use of a number of implicit assumptions about that common sense, such as, in the first place, that it may in some way be formally represented. In this article, we examine this project in order to make visible some of these hidden assumptions that we regard as important. We attempt also to show how common sense knowledge expressed in CYC carries with it worldviews and notions of what constitutes valid knowledge that derive from the perspective of its developers.

Artificial intelligence; Common sense; Epistemological assumptions; Technology and society; Knowledge


ARTIGO

"Coisas que as pessoas sabem": computação e territórios do senso comum

Rafael WildI; Vanessa MaurenteII; Cleci MaraschinIII; Maria Cristina BiazusIV

IDoutorando bolsista do CNPq no Programa de Pós-graduação em Informática na Educação da Universidade Federal do Rio Grande do Sul, Brasil. rafael.wild@ufrgs.br

IIProfessora da Pontifícia Universidade Católica do Rio Grande do Sul, Brasil. vanessamaurente@yahoo.com.br

IIIProfessora Doutora do Instituto de Psicologia em Informática na Educação da Universidade Federal do Rio Grande do Sul, Brasil. clecimar@orion.ufrgs.br

IVProfessora Doutora do Programa de Pós-graduação em Informática na Educação da Universidade Federal do Rio Grande do Sul, Brasil. cbiazus@ufrgs.br

RESUMO

A inteligência artificial constrói, através da computação, sistemas com capacidades especiais na medida em que são capazes de realizar tarefas elaboradas para as quais a inteligência humana seria, em princípio, essencial. Um desses sistemas, um projeto de longo prazo e larga escala conhecido como CYC, propõe-se a uma tarefa considerada muito difícil, que é a de representar e tornar utilizável computacionalmente o conhecimento de senso comum, isto é, conhecimento não especializado, de que as pessoas lançam mão no decorrer do dia a dia sem mesmo dar-se conta de que o estão utilizando. Para realizar este projeto, seus criadores partem de premissas não explicitadas, tais como a de que esse conhecimento é, em primeiro lugar, representável de alguma maneira formal. Examinaremos com atenção esse projeto, para tentar tornar visíveis algumas dessas premissas que consideramos importantes. Buscaremos mostrar, ademais, como o conhecimento ali expresso é marcado pela perspectiva dos seus criadores sobre o mundo e sobre o que se constitui como conhecimento válido.

Palavras-chave: Inteligência artificial. Senso comum. Pressupostos epistemológicos. Tecnologia e sociedade. Conhecimento.

ABSTRACT

The discipline of artificial intelligence has been able to build computational systems with remarkable abilities concerning some difficult tasks for which a human intelligence would otherwise be required. One of those systems, a long term and large-scale enterprise known as CYC, aims to represent and to make usable by computational means the common sense knowledge. Common sense is, in this situation, non-expert knowledge of the world around us, of the type people put to use in their day-to-day affairs. The creators of CYC make use of a number of implicit assumptions about that common sense, such as, in the first place, that it may in some way be formally represented. In this article, we examine this project in order to make visible some of these hidden assumptions that we regard as important. We attempt also to show how common sense knowledge expressed in CYC carries with it worldviews and notions of what constitutes valid knowledge that derive from the perspective of its developers.

Keywords: Artificial intelligence. Common sense. Epistemological assumptions. Technology and society. Knowledge.

INTRODUÇÃO

A inteligência artificial (IA), ao construir sistemas computacionais capazes de realizar tarefas complexas para as quais normalmente se considera que é exigido o desempenho de inteligência humana, constitui-se em um campo de desenvolvimento tecnológico que chama a atenção por vários motivos. Suas realizações práticas impressionam, trazendo consigo como efeito um encantamento tecnológico. Demonstram como máquinas são capazes de computar e agir sobre o mundo de formas que pareciam, até ontem, terreno restrito da distintiva capacidade humana – realizando atividades que em muitos casos apresentam certo grau de dificuldade mesmo para um humano. As questões que essa ciência levanta também despertam amplo interesse. Se, por um lado, a IA procura identificar e realizar no computador o que parece humano, por outro, a própria realização na máquina já interroga se o que foi produzido é de fato distintivamente humano.

Para os objetivos deste texto, a inteligência artificial será considerada a partir de uma perspectiva proposta por seus participantes: como um ramo da engenharia e como um campo da tecnologia e da ciência. Seu objetivo, segundo essa perspectiva, é o desenvolvimento de artefatos computacionais que realizem tarefas associadas à inteligência ou à racionalidade; algumas de suas linhas investigam ou procuram replicar a forma como o ser humano desempenha essas tarefas ou esses processos de inteligência e racionalidade, enquanto que outras procuram maneiras mais especificamente computacionais (ou seja, não necessariamente similares à humana) para desenvolver seus sistemas.

Ao longo de seu histórico, desde 1950 quando Turing apresentou seu "teste" para inteligência de máquina (Turing, 1950), a IA foi sendo constituída, como realização tecnológica e científica, a partir de diferentes maneiras de abordar a questão da inteligência, assim como pelos desafios a que se dedicou. Alguns desses momentos são apresentados em Luger (2002, cap. 1) e Russell & Norvig (1995, cap. 1 e 2), que retomam, de maneira abrangente mesmo que resumida, uma descrição do escopo e histórico da IA. Assim, o início da IA, durante as décadas de 1950 e de 1960, concentrou-se em questões de raciocínio lógico-matemático automatizado e de representação simbólica de conhecimento. Em paralelo com a IA, nesse período foi desenvolvida a Cibernética, dedicada a investigar os processos de controle e informação, através da noção de realimentação, em sistemas biológicos e eletrônicos não-simbólicos (cf. Wiener, 1970). Posteriormente, outras abordagens emergiram, buscando explorar alternativas tanto em relação aos problemas a serem resolvidos, como em relação à introdução de técnicas diferentes. Uma dessas abordagens é o conexionismo, que retomou destaque na década de 1980, e que procura resolver problemas de maneira sub-simbólica, através da implementação de entidades computacionais similares a redes de neurônios conectados entre si (um breve histórico em Russell & Norvig, 1995, p. 594). Ligada a ela está a abordagem da robótica incorporada ou situada (cf. Steels & Brooks, 1995), em que a representação simbólica seria substituída por manipulação mais direta dos dados do ambiente. Mais recentemente, pesquisadores em IA voltaram-se também para o tratamento de problemas que envolvem dados conhecidos de maneira parcial, probabilística ou incerta (cf. Li, 2008) e para o desenvolvimento de sistemas a partir de agentes em software (como, entre outros, propõem Russell & Norvig, 1995). Essas diferentes abordagens estão presentes em um grande número de artefatos computacionais contemporâneos, na forma de programas de computador, serviços e equipamentos.

A IA mantém um tenso diálogo com uma série de outras disciplinas, gerando discussões e influenciando (e sendo influenciada por) posturas teóricas que atravessam, entre outras áreas, a filosofia, a biologia e a psicologia. Um exemplo é a ciência cognitiva, que ao investigar o pensar e o conhecer humanos, intercambiou ao longo de sua trajetória, com a IA, com a biologia e com a filosofia, vários conceitos e metáforas explicativas: o pensamento como ato computacional, o ato cognitivo como resultado da interação entre elementos neurais unitários interligados, a consciência como propriedade emergente de um sistema complexo. Para dar conta do caso aqui apresentado, engajar-nos-emos com algumas contribuições de outras disciplinas que ampliam o horizonte da IA e trazem para a cena outras maneiras de compreender e discutir o humano e o que é encenado na máquina como característico do humano.

O presente trabalho procura investigar uma dessas formas de ser "ser humano" de que a IA se apropria e coloca, exercendo-a no domínio da máquina, ao serviço das pessoas: o conhecimento. Estamos nos referindo aos sistemas especialistas, também chamados de sistemas baseados em conhecimento, que são programas de computador que codificam, em uma base de conhecimento, conjuntos de conhecimento, como fatos, relações e regras, de disciplinas específicas (cf. Harmon, 1985; Russell & Norvig, 1995). Abordaremos um sistema especialista em particular, CYC (Guha & Lenat, 1990), que procura diferenciar-se de outros sistemas através da codificação, em sua base de conhecimento, do senso comum. A proposta de seus autores é criar um sistema capaz de lidar com um grande número de situações simples nas quais outros sistemas falham porque são restritos em seu escopo. O escopo de CYC pretende ser "amplo", incluindo todo o conhecimento corriqueiro que as pessoas empregam comumente para realizar as tarefas de seu dia a dia. Os autores do sistema descrevem de várias maneiras o que seria "todo" esse conhecimento, "comum" a todos e "corriqueiro".

Procuraremos, neste artigo, examinar como esse conhecimento é descrito e como é produzido. A partir de exemplos provenientes desse corpus, buscaremos questionar algumas das premissas implícitas na proposta de CYC e colocar em perspectiva as características que seus autores expressam sobre esse conhecimento. Essas características declaradas para CYC, tais como de ser um conhecimento universal e consensual, acessível e compreensível, podem ser interrogadas, com o intuito de mostrar como estão relacionadas à adoção de pressupostos epistêmicos que apagam seu caráter contextual e implicado com o sujeito. A partir destes questionamentos, nossa intenção é tornar visíveis as condições em que este conhecimento se torna válido, e como é ancorado em um regime de verdades que provê para sua validade e que, ao invés de universal e consensual, é situado e contingente.

1. CONHECIMENTO E SISTEMAS ESPECIALISTAS

Sistemas especialistas são interessantes porque materializam e colocam em operação uma interpretação específica do que é conhecimento. A construção e a utilização de bases de conhecimento em sistemas especialistas tornam visível a abordagem epistemológica que as suporta. Conhecimento, para os proponentes desses sistemas, é visto como um conjunto de afirmações e regras declarativas sobre um dado campo de saber. Trata-se, sob esse ponto de vista, de um conjunto objetivo, coerente e não-problemático, sob domínio da pessoa que é especialista na área. Essa posição é desdobrada de várias formas: na maneira como é afirmada a existência de um tal conhecimento, na abordagem do problema como sendo uma questão de representação do conhecimento, e na pouca atenção que é dada aos processos pelos quais esse conhecimento é obtido – a partir do especialista, pelo engenheiro de conhecimento.

Sistemas desse tipo começaram a ser desenvolvidos durante a década de 1970, nos Estados Unidos, com aplicação em áreas de especialidade tais como diagnóstico médico (o sistema MYCIN) e prospecção geológica (sistema PROSPECTOR). Seu funcionamento baseia-se na codificação, ou, segundo a linguagem de seus praticantes, na representação de fatos e de regras que descrevem o conhecimento da área em questão, bem como na aplicação de inferência lógica no encadeamento dessas regras, para chegar a uma afirmação que responda ao problema proposto. Tais sistemas, segundo seus proponentes, são capazes de realizar tarefas que requerem conhecimento específico de uma área, em um nível próximo ou superior ao de um especialista (cf. Harmon, 1985).

O conjunto codificado de conhecimentos, que caracteriza e é ponto de partida para a operação do sistema especialista, é chamado de base de conhecimento. A base de conhecimento é construída por profissionais chamados de "engenheiros de conhecimento", a partir da coleta de informação fornecida por especialistas humanos, ou por fontes documentais. Essa informação é, em seguida, codificada e sistematizada – representada – em uma linguagem lógica ou computacional específica, como regras e procedimentos, e tais regras e procedimentos são representados em linguagens computacionais adequadas. Um sistema completo típico constitui-se da base de conhecimento, de um módulo lógico que é responsável por encadear as regras adequadamente para chegar a uma resposta, e da interface através da qual a tarefa é codificada para ser apresentada ao programa e a resposta é publicada.

Para compreender melhor as questões que procuraremos colocar, é importante prestar atenção ao conceito de conhecimento que é empregado em cada caso, e em como esse conceito é colocado em prática. Harry Collins examina detidamente os "sistemas especialistas" e a maneira como a inteligência é atribuída a esse tipo de dispositivo tecnológico (cf. Collins, 1990). Partindo de uma perspectiva de estudo cujo objeto é a tecnologia e a ciência, Collins mostra como sistemas especialistas inserem-se em uma tradição mais ampla de desenvolvimento de máquinas que são construídas para executar, de forma codificada, ações específicas que são parte importante de tarefas que envolvem práticas cognitivas e culturais. Nessa perspectiva, as máquinas funcionam quando as ações codificadas que são capazes de realizar são embutidas dentro da prática mais ampla das pessoas que utilizam e interpretam essas ações codificadas. Um exemplo apresentado por Collins é a máquina calculadora simples, que codifica a ação integrada de teclas e visor que, quando operada e interpretada por uma pessoa com a destreza necessária, realiza a função aritmética de somar ou multiplicar.

Collins (1990) mostra que esse também é o caso do sistema especialista que representa o conhecimento em uma base digital de conhecimento e de regras. Esses sistemas são cuidadosamente construídos para codificar o trabalho complexo de um especialista em uma determinada área de atuação. Como resultado, a própria operação do programa exige familiaridade com a área, já que é necessário conhecer os conceitos em cujos termos serão formuladas as interações com o programa, colocar o problema e compreender a resposta obtida, e, em resumo, interpretar no mundo real o que conta como atualização válida dos conceitos, critérios e resultados da área. Em outras palavras, se um sistema especialista de apoio ao diagnóstico médico menciona "febre", o operador do programa precisa competentemente interpretar esse conceito no contexto do corpo do paciente, sabendo pragmaticamente como medir febre – manipulando o corpo do paciente e o instrumento de medição – e como decidir sobre a categoria "febre" a partir dos resultados da prática – qual foi a temperatura medida, em qual parte do corpo do paciente, em qual horário do dia.

O conhecimento codificado e enunciado no computador, portanto, não funciona isolado e independente em um mundo conceitual, mas embutido em um universo de práticas culturais de pessoas que o interpretam, o utilizam e assim o tornam significativo. O conhecimento é interpretado e não é autoevidente; o significado de um enunciado particular do conhecimento é construído dentro do compartilhamento de um conjunto de conhecimentos sobre o mundo (cf. Forsythe, 1993).

Essa é uma forma de compreender uma das características relevantes dos sistemas especialistas: a necessidade de que a pessoa que os utiliza conheça também os conceitos e processos envolvidos na prática da especialidade à qual o sistema é dedicado. É necessário interpretar adequadamente os passos de interação do sistema e saber manipular a informação solicitada e fornecida. Em suma, é preciso que o sistema seja operado por um humano que entenda o que está sendo processado e possa compreender a resposta e colocá-la em prática.

Além disso, esses sistemas lidam com dificuldade com situações envolvendo conhecimentos que não estão explicitamente incluídos no universo de conhecimento, mesmo que conhecimentos aparentemente simples e não especializados, com os quais pessoas estão acostumadas a lidar. Essa dificuldade pode ser sentida, por exemplo, em livros-texto, na cuidadosa apresentação de maneiras de efetuar, para efeitos de IA, categorização de objetos que no cotidiano são apreendidos de maneira prática por pessoas em seu dia a dia. Um exemplo muito citado é a categoria "ave"; aves voam e essa é uma característica importante desses animais, mas há aves que não voam, tais como avestruz. Outro exemplo é o de conclusões implícitas relacionadas a certos fatos: pessoas possuem normalmente dois braços, entretanto há pessoas que possuem apenas um braço; ademais, pessoas que possuem apenas um braço possuem apenas uma mão (ambos exemplos em Harmon, 1985, p. 37). Conta-se que o sistema MYCIN, certa vez, teria sugerido gravidez como causa do estado febril de um paciente do sexo masculino (cf. Forsythe, 1993; Luger, 2002). Embora não seja necessário ser um especialista médico para saber que apenas mulheres ficam grávidas, um sistema especialista não tem acesso a esse conhecimento a não ser que seja de alguma forma representado em sua base. Essa tendência a falhar quando a interação do sistema foge do escopo específico, mesmo que o que esteja em jogo não seja conhecimento especialista, é conhecida como fragilidade do sistema baseado em conhecimento (cf. Google TechTalks, 2006; Panton et al., 2006).

Essas características não costumam ser uma limitação problemática em muitos casos; o esforço de projeto para a criação desses sistemas é focalizado para áreas de saber altamente formalizadas e cujos problemas a resolver são bem definidos, com abrangência muito específica, propositadamente deixando de lado a possibilidade de interação fora do escopo escolhido para o sistema. Além disso, espera-se que a operação desses sistemas, como já mencionado acima, seja realizada por pessoas que dominem a respectiva área de saber, e que portanto interpretam adequadamente os conceitos e procedimentos mencionados pelo sistema.

Mesmo que a restrição a escopos de aplicação específicos e a utilização por pessoal qualificado dêem conta das características apresentadas acima, persiste, entre os proponentes da IA em geral, e dos sistemas especialistas em particular, a questão de como construir sistemas que não demonstrem a mencionada fragilidade em relação ao conhecimento não-especialista do mundo. A resposta encontrada foi a de adicionar o que é percebido como o conhecimento que falta: o conhecimento não-especialista, o conhecimento de senso comum (cf. McCarthy, 1984).

2. SUPRINDO UM DÉFICIT: CYC

Um dos projetos conhecidos por seu esforço em trazer o senso comum ao domínio dos sistemas especialistas é CYC (cf. Guha & Lenat, 1990). Douglas Lenat iniciou em 1984 o projeto, que continua em andamento sob sua coordenação. A abordagem de CYC para a questão do senso comum é "prover um repositório de senso comum formalmente representado". Lenat propõe que um repositório desse tipo pode funcionar como uma espécie de substrato referencial ao qual sistemas especialistas "especialistas" poderiam recorrer quando o problema não está contido em seu domínio específico, mas não requer, por sua vez, recurso a uma outra especialidade. A motivação é apresentada por Lenat com exemplos jocosos em que sistemas especialistas falham (cf. Google TechTalks, 2006). Um desses exemplos é o de um sistema médico especialista, em que o "consultando" é um velho e enferrujado automóvel Pontiac com "manchas marromavermelhadas no corpo": o diagnóstico do sistema para o "paciente" é sarampo. Lenat aponta essa situação como um exemplo da mencionada fragilidade, e a considera como uma limitação e um problema a ser resolvido em um contexto em que aplicações de sistemas de IA tornam-se mais difundidos e mais importantes.

O senso comum com o qual prover CYC é, segundo seus proponentes, aquele "conhecimento geral que nos permite sobreviver no mundo real, e entender e reagir com flexibilidade diante de situações novas" (cf. Panton et al., 2006) e constitui-se de fatos e regras empíricas e "assim por diante", que devem ser passadas para o sistema. O objetivo é coletar um número muito elevado de afirmações válidas sobre o mundo, um corpus de conhecimento que inclua o que pessoas sabem, e que permita ao sistema fazer inferências lógicas sobre questões "não especialistas", inferências que seriam as mesmas que as pessoas fariam sobre essas questões.

A colocação do conhecimento de senso comum como simples e não-discutível indica que esse deveria ser, de acordo com a proposta de CYC, composto de declarações diretas, imediatas, sobre o objeto de conhecimento, sem margem a interpretações que, vistas como ambiguidades algo incômodas, obscureceriam a verdade sobre o objeto. Por outro lado, há evidências de que o conhecimento objetivo e compartilhado sobre o objeto, incluindo o contexto cotidiano do senso comum, é efeito do estabelecimento de uma teoria sobre esse objeto. Essa teoria é construída pelo indivíduo a partir do corpus de conhecimento socialmente adquirido, e da interpretação da sua experiência sensória sobre o objeto. O objeto torna-se claro e manuseável quando manipulamos e recriamos as categorias e teorias de que dispomos para ali acomodar o novo objeto (cf. Karmiloff-Smith & Inhelder, 1975) – isto é, ao relacionar de forma exploratória, repetidas vezes, o objeto com a teoria de que dispomos. É dessa maneira que distinguimos novos objetos, tais como novas frutas que conhecemos, e as acomodamos dentro do nosso universo alimentar, distinguindo-as de outros objetos que em princípio compreendemos diferentemente. Na teoria cotidiana, que eu enquanto sujeito conhecedor-em-senso-comum compartilho, maçãs são próximas de maracujás, e separadas de tomates, em razão da categoria fruta dentro das quais as recebo e interpreto (há categorias, por exemplo, em que o tomate é uma fruta).

Um extenso corpo de pesquisas, por exemplo as formuladas pelas etnoepistemologias e pela epistemologia enativa, sugere que a construção do entendimento do mundo não é consensual ou universal. Humberto Maturana (Maturana & Varela, 2001) afirma que o conhecimento está sempre relacionado "à operação de distinção de um observador". Assim, um conhecimento é para alguém e nunca em si. O observador não é preexistente, mas se constitui como tal inscrito corporalmente em uma comunidade de observadores que compartilham operações congruentes e critérios de validação. O conhecimento é então resultado de coordenações de ações em mundo. Em outras palavras, o conhecer não é uma questão representacional, mas uma agência inscrita no sujeito conhecedor através do viver. Por outro lado, a ação concertada e o compartilhamento de saberes são chaves pelas quais o indivíduo aprende a interpretar o mundo, e é o contexto em que é demonstrado como "válido".

3. UMA PERSPECTIVA PARTICULAR SOBRE O UNIVERSAL

A definição que CYC propõe para "conhecimento" embute, na realização do sistema, algumas características importantes, mas não explicitamente discutidas. Partimos aqui do pressuposto de que um corpo de conhecimento estabelecido traz consigo as marcas de quem o construiu e de sua proposta de mundo. O conhecimento dito verdadeiro é algo "criado" e reforçado por encontros e desencontros de forças, onde "quem" o afirma é, portanto, relevante na comunidade de observadores que compartilham essa evidência. Há um contraste dessa posição com a epistemologia tradicional do "sujeito universal", na qual é apagada a situação particular de quem enuncia o saber (como destacado por Adam, 1998). Levamos, pois, em conta que critérios de validação não estão referidos a uma determinada realidade independente, mas resultam de uma tensa consensualidade de um coletivo de pesquisadores que compartilham um domínio de práticas e conceitos. Essa consensualidade tece uma rede densa que estabiliza o conhecer, ao mesmo tempo tornando-o válido (e, portanto, produtivo) e marcando de forma peculiar essa validade. Um exemplo é o debate travado, na Inglaterra do século xvii, sobre o estatuto do fato científico experimental, no caso a bomba de vácuo inventada por Robert Boyle (cf. Shapin, 1985). A questão, proposta por Boyle e que se tornou fundamental para o avanço da física experimental como a conhecemos, era como estabelecer fenômenos como fatos, dado o problema de quem havia encenado o experimento, como o havia feito, e quem eram as testemunhas – e, principalmente, dado o problema da existência de outras formas de se chegar à verdade. A proposta de Boyle entrava em conflito com outras categorias de verdade em uso e consideradas como válidas, como por exemplo o uso da razão como forma de validação de uma proposição. O conhecimento é resultado de um campo de lutas e contradições, em que a interação com outros domínios de saber e relações de poder entram em jogo para tornar alguns enunciados mais legítimos que outros. Nesse sentido, a verdade não pode ser tomada como algo universal e passa a ser compreendida também como uma questão política, enredada nos critérios de validação hegemônica (ver, por exemplo, a discussão em Dreyfus, 1983, p. 114-7).

Ao mesmo tempo em que a verdade se produz politicamente, o efeito dessa mesma verdade é político. Em geral, ela reproduz as relações que a tornaram possível. Nesse sentido, é interessante observar como dialogam entre si o aspecto técnico, explicitamente assumido, e o aspecto político, menos explicitamente discutido, dentro do projeto CYC. As características técnicas desejadas para CYC estão ligadas ao projeto epistêmico que lhe dá sustentação, e por sua vez as soluções encontradas para o problema técnico vão fazer parte da constituição de suas formas políticas. Colocar certos itens de conhecimento em discussão, ou não, depende de quem é a fonte desse conhecimento, e o resultado é a legitimação do ponto de vista dos grupos que participaram nessa construção. Essa é uma forma de estabelecer certas verdades e apagar outras, materializada em uma ferramenta que propõe, revestida do prestígio simbólico da "computação" e da "inteligência artificial", ser "a" referência no conhecimento sobre o mundo.

Outra interessante premissa epistêmica é a descrição do senso comum como universal, acessível, e não-problemático: "o tipo de conhecimento básico que podemos assumir que agentes humanos possuem" (Taylor et al., 2007, p. 140). Os proponentes de CYC sugerem que o "mundo" pode ser acessado e entendido de forma consensual e determinada, independente de quem está engajado no processo de entender. Da forma como é apresentado, esse conhecimento também é considerado enunciável, isto é, pode ser dito e representado de forma "direta" e simplificada. Ao mesmo tempo, o fato de que um grupo restrito tenha a posse e o acesso a esse conhecimento não parece algo questionável, assim como o fato de que alguns sistemas não teriam o apoio desse cabedal. Douglas Lenat expressa dessa forma em que consiste esse conhecimento geral e universalmente difundido que deve preencher a base de dados de CYC: "vamos dizer ao computador todos os tipos de coisas que você sabe sobre carros, cores, a Torre Eiffel, a altura dos edifícios, e filmes, e assim por diante" (Google TechTalks, 2006).

É interessante observarmos que a expectativa de "acumular" um senso comum universal não surpreende demasiadamente a alguns cientistas. Entretanto, a aparente consensualidade mesmo sobre esses itens tão simples e conhecidos de nosso mundo pode ser colocada em xeque a partir de alguns questionamentos sensíveis – e que nem por isso deixam de ser sensatos. Essa lista deixa entrever o universo de conhecimento de quem formulou a lista, um universo em que há edifícios e no qual é sabida sua altura, em que a Torre Eiffel participa como objeto arquitetônico amplamente conhecido. Nesse universo, é natural que carros sejam importantes e pessoas saibam muito sobre esse tema (cf. Interrante, 1983), e as cores de objetos sejam indiscutíveis (cf. Goodwin, 1994).

O problema que se coloca é como decidir quais fatos e quais regras são indiscutíveis – um carro não tem o mesmo significado em todas as culturas tal como na cultura americana, e, em que pese a globalização, tampouco são os mesmos em todos os lugares (no Brasil, por exemplo, os motores de carros saem de fábrica aptos a serem abastecidos com álcool ou gasolina indiferentemente). Dada a naturalidade com a qual se assume um conhecimento incontrovertido sobre esses objetos, vale perguntar: como e por que um conhecimento como esse pode ser considerado universal, excluindo uma série de pessoas que poderiam não compartilhar desse saber? Qual é a consequência para uma pessoa que falhar em compartilhar desse conhecimento (dito) universal, ou seja, qual o efeito político desse conhecimento técnico? Tudo se passaria como se esse conhecimento definido como sendo de senso comum também fosse independente dos domínios dos fazeres e das linguagens que os constituem, ou seja, autoevidentes sem a participação do observador.

Acompanhando esta demarcação do que seria ou não legítimo, verifica-se também a legitimação de um determinado corpus como válido e relevante. Em outras palavras, quando marcamos a Torre Eiffel como simplesmente "coisas que pessoas sabem", estamos estabelecendo de forma sutil ao mesmo tempo duas relações sobre as quais se deve refletir com cuidado. Em primeiro lugar, estabelecemos a necessidade de conhecer tais objetos culturais para pertencer à categoria de "pessoas que sabem" e para ser capaz de "sobreviver no mundo real" e, em segundo lugar, estabelecemos que objetos culturais, conhecidos por diferentes grupos e que não estão no corpus, não são importantes para agir competentemente no mundo ou para ser uma pessoa que sabe. A demarcação do conteúdo não é explicitada no projeto de CYC. No entanto, contrastando com a simplicidade alegada para esse conteúdo – aquilo que até "Og, o homem das cavernas" sabia (cf. Google TechTalks, 2006) – o projeto é um complexo empreendimento científico-tecnológico. Para dar conta do desafio a que se propôs, elaborou uma linguagem lógica expressiva que tornasse factíveis as tarefas de raciocínio e inferência utilizadas para manipular as declarações e relações que compõem sua base de conhecimento. Lenat descreve que o problema da coexistência de afirmações não consistentes entre si, ou mesmo contraditórias, não demorou a surgir no decorrer do projeto (cf. Panton et al., 2006). A solução encontrada para dar conta do problema que essa situação representava para CYC foi a criação de microteorias. Microteorias em CYC são contextos de raciocínio, dentro dos quais afirmações devem ser consistentes. Microteorias são organizadas em uma estrutura de árvore (ou mais especificamente, em um grafo direto); aquelas de "alto nível" são as mais genéricas, as quais são progressivamente subdivididas em contextos mais específicos (cf. Taylor et al., 2007). A divisão estanque entre conjuntos de afirmações aparentemente contraditórias, no entanto, é uma solução que satisfaz o problema de lógica, de representação em termos computacionais. Não há evidência de que esse tipo de compartimentação da realidade seja a forma como tratamos o nosso estar no mundo mediado pelo conhecimento de senso comum (conforme discutido, a respeito de CYC, por Adam, 1998).

Adicionar conhecimento e manipulá-lo, portanto, longe de parecer-se com o uso cotidiano do senso comum, é uma atividade especializada que demanda um saber específico e não universalmente acessível, que é o da lógica matemática e sua aplicação à computação. Esse fato ajuda a elucidar quem de fato adiciona conhecimento e o manipula, em CYC. Há várias indicações de que o conhecimento que abarrota CYC tem sua origem nos saberes de especialistas, e é selecionado e estruturado em função dos valores e particulares perspectivas desses grupos de especialistas. Naphade et al. (2006) descreve um projeto, com a participação da equipe de CYC, que propõe estabelecer uma ontologia para classificar conteúdo de multimídia, incluindo as categorias adequadas para descrever esse conteúdo. Segundo o artigo, foram reunidos nesse esforço em particular "especialistas de diversas comunidades para criar uma taxonomia de 1000 conceitos para descrever vídeo-noticiários". O projeto relaciona-se com CYC de diversas maneiras, incluindo a validação dessa ontologia comparando-a com relação de conceitos já presentes em CYC. A participação de especialistas é essencial para assegurar que as categorias descrevam, de forma adequada e relevante, o conteúdo, de modo que possa ser acessado e classificado de diversas maneiras, incluindo métodos automatizados. No entanto, o resultado não é um sistema de categorias utilizado cotidianamente, próximo ao senso comum (seja de qual grupo for) – mas sim um sistema complexo, altamente estruturado, adequado para as necessidades de especialistas e particularmente para o tratamento computacional dessa informação. A perspectiva do pesquisador enquanto observador não é sublimável em uma perspectiva externa, "de lugar nenhum"; por esse motivo, e em especial quando se busca apagá-la, essa posição de observador ressurge inscrita no conhecimento construído.

De maneira semelhante, são frequentes as menções à dificuldade de se lidar com conhecimento não-especialista (i.e., senso comum) e com as pessoas que o detêm. Desde a observação de que "especialistas de área geralmente não distinguiam elementos genéricos de instanciados sem serem instruídos" (Witbrock et al., 2005, p. 101), até o relato de que "historicamente, todas as afirmações foram incluídas no CYC por ontologistas, engenheiros de conhecimento humano que estão familiarizados com a estrutura de Mt [microteorias] e capazes de determinar o posicionamento adequado em Mt" (Taylor et al., 2007, p. 141), ou ainda a descrição do processo de representação como "doloroso", há muitas indicações de que o senso comum não é facilmente "capturável". Para que o conhecimento em CYC esteja formulado da maneira apropriada, é necessária a intervenção de especialistas, que afinal constituem a população a partir da qual esse conhecimento é obtido. O conhecimento em questão é válido, mas dificilmente pode ser considerado "senso comum" e "universal".

Lenat propõe outras maneiras para constituir o conhecimento em CYC, em parte para diminuir o que é encarado como um gargalo no projeto – a lenta e dolorosa (cf. Panton et al., 2006; Witbrock et al., 2005) tarefa de entrada de dados por especialistas. Uma delas é um portal na internet,1 1 Chamado de FACTory, em http://opencyc.com. aberto à participação de voluntários, para coletar "fatos". O portal formula uma série de afirmações a respeito dos conceitos presentes em sua base. Essas afirmações são apresentadas, em um formato de "jogo", aos voluntários – "noviços", isto é, não-ontologistas ou especialistas. Os participantes então devem avaliar e validar – dizer se são válidas ou não – essas afirmações.

O portal, conforme proposto, é uma maneira interessante de abrir o projeto à participação de não-especialistas, e de contar com o precioso (e difícil) conhecimento comum e cotidiano. Há algumas barreiras, entretanto, à participação em CYC e, embora não sejam imediatamente visíveis nem tampouco sejam abertamente discutidas pelos proponentes, pode ser instrutivo deter-se um momento sobre elas. A primeira é o fato de o portal ser escrito em inglês, o que coloca uma exigência nada universal – mesmo que não seja extraordinariamente restritiva. A segunda é o próprio fato de ser um portal na internet, fazendo do acesso a um computador e à rede uma necessidade para a participação. Por fim, deve ser levado em conta o contexto e a natureza do projeto: é um projeto computacional desenvolvido dentro da disciplina muito especializada de IA e divulgada basicamente dentro dessa comunidade. Ser parte dessa comunidade não é um requisito formal para o engajamento, mas chegar ao portal e participar no desafio proposto é mais acessível para quem partilha dos conhecimentos e motivações da comunidade.

A iniciativa do portal na internet, além da oportunidade de uma pequena participação nesse fascinante projeto, permite ao interessado um vislumbre mais direto sobre a visão de mundo construída nessa base de conhecimento. Ao participar da enquete, um dos autores foi inquirido sobre o íon cromato – "todo o íon hidrogênio cromato tem exatamente um átomo de hidrogênio". Sua formação como engenheiro tornava esse tema ao menos um pouco familiar – embora não tivesse certeza sobre a afirmação no momento. Após alguns tempo de pesquisa pôde resolver a dúvida e responder "sim". A natureza científica e estruturada do conhecimento em questão é visível – trata-se de um tipo específico de verdade corriqueiramente manipulada por um grupo também específico. Uma das questões a seguir, em contraponto, coloca em evidência o problema do senso comum: "Todo pudim inclui algum sal de cozinha". Um exame cuidadoso da questão traz à tona o seu caráter não determinável, ou seja, a dificuldade que há em dar uma resposta definitiva e universalmente válida a ela. Saberes da cozinha são enunciados e praticados de maneira diferente daqueles da ciência, e a adição de um bocadinho de sal a receitas doces é considerada necessária em algumas tradições familiares e em outras não. A adição de sal pode não constar da receita escrita, mesmo que recomendada pela tradição. Nesse caso, uma resposta "sim", tanto como uma resposta "não", seriam respostas válidas, mas extremamente parciais, que ganhariam validade apenas se explicitadas dentro de um corpo referente a uma tradição culinária. A inclusão ou a interdição de ingredientes na alimentação remetem a ressonâncias em outros âmbitos da vida social, não sendo puramente utilitários (cf. Douglas, 1972) e isso também é válido para o sal em nossa sociedade contemporânea (cf. Arnaiz, 2001).

Também presentes, na rodada de questões selecionadas pelo sistema, estavam questões sobre cultura: "Christopher Petiett aparece em 'Boys'" e "'The Clown' foi originalmente escrito em inglês". Dado o fato da linguagem que permeia CYC ser o inglês, não é estranho que estejam em pauta obras culturais em inglês. De uma perspectiva um pouco mais distante, no entanto, é visível, pela maneira sucinta em que foram escritas as declarações, que não se espera que haja dúvidas ou ambiguidades a respeito do contexto das obras ou seus autores. Esse não parece ser o caso, de qualquer forma, mesmo entre a comunidade de validadores de CYC. Após respondermos "não sei" à primeira questão, o sistema admitiu, de maneira algo surpreendente: "Ok, acho que isso é mesmo muito obscuro".

Um conjunto de conceitos de CYC relacionados a "trabalho" constitui um caso adequado para investigar a marca do conhecedor em uma base de conhecimento que reivindica um conteúdo "universal". O conceito "trabalho" é descrito sumariamente em CYC como um exercício individual:

Atividades que requerem um certo aporte de esforço físico ou mental, e que não são realizadas puramente por recreação, mas como parte de uma ocupação (para ganhar a vida), ou para contribuir para algum objetivo, ou por causa de alguma outra obrigação ou necessidade. Exemplos incluem um estudante fazendo trabalho de casa para a escola, um proprietário aparando seu gramado, um professor dando aulas, etc.2 2 http://sw.opencyc.org/concept/Mx4rvVjhIpwpEbGdrcN5Y29ycA.

Nada há aqui que indique as dimensões sociais do trabalho, como um fenômeno de construção de realidades e de riquezas percebido em uma escala além do sujeito individual atômico e autônomo. Trabalho, na definição aqui encontrada, é uma atividade não problemática e bem delimitada. A definição explicita, de maneira abstrata, mas que denota uma preocupação com abrangência, uma série de motivações para o trabalho. No entanto, os conceitos relacionados que podem ser encontrados em uma busca nessa base vão compondo um quadro de compreensão bastante específica, nada "universal", do fenômeno trabalho: "semana de trabalho" ("cinco instâncias sucessivas de Dia Calendário") e "dias úteis" ("dias em que trabalhadores de escritório e operários normalmente vão ao trabalho e em que estudantes [...] vão à escola"), "plano de trabalho" ("coleção de documentos que contêm informação sobre quando cada empregado deve trabalhar"), "posto de trabalho" – "inclui local da caixa registradora, balcões de expedição, estações de máquinas operatrizes, balcão de trabalho de cozinha (com todos os equipamentos)". Esse conjunto de conceitos, formulados dessa maneira, aponta para uma descrição adequada, mesmo que purificada de elementos controversos, do mundo do trabalho, mas que é também muito específica. Vemos aqui um universo de trabalho organizado e institucional, com empregados (e empregadores), regido por documentos, organizado e distribuído no tempo da semana e no espaço do local próprio do trabalho. Para tornar ainda mais visível o ponto de vista nada universal a partir do qual esse trabalho é visto e descrito, é instrutivo observar a definição de "visto de trabalho": "Um visto de trabalho nos Estados Unidos, permissão do governo dos Estados Unidos para um não-cidadão trabalhar no país". O conceito visto de trabalho, aparentemente genérico, torna-se particular, específico na sua definição, e sua vinculação geopolítica torna-se explícita – e informativa, para além do recorte inicial da intenção dos seus formuladores.

Retomando a discussão de Adam sobre o sujeito conhecedor implícito considerado por projetos tais como CYC, a descrição de mundo encontrada em CYC, como vemos, pode ser examinada com atenção para dizer muito sobre os sujeitos reais que se dedicaram a essa tarefa. Formalizar o conhecimento sobre o mundo é materializar em declarações pontuais um saber que é difuso, no sentido de que não é formulado ou formalizado antes de colocado em questão. Cada declaração responde a uma pergunta, uma problematização que por si já é uma indicação de relevância do ponto específico problematizado para o sujeito que realiza esse trabalho. Os conceitos em CYC aqui apresentados mostram, como aponta Adam, que o saber está intimamente implicado com o sujeito sabedor, em um regime de verdades no qual esse saber se constituiu. Ambos podem adquirir a aparência de separação apenas quando, por esforço explícito ou por condição implícita, a alteridade e a multiplicidade de outras comunidades de saber são invisibilizadas ou desconsideradas. Por outro lado, quando a invisibilidade do saber outro é a condição estabelecida e o saber legítimo parece universal, é preciso um olhar cuidadoso para fazer aparecer as fissuras a partir das quais situar e localizar esse conhecimento e os sujeitos a ele ligados.

4. COMENTÁRIOS FINAIS

CYC, como um projeto de sistema computacional, é uma proposta audaciosa de construção de um programa capaz de lidar com um domínio difícil: o do conhecimento cotidiano, o senso comum. A consideração atenta do projeto sugere que o senso comum ali é figurado como universal, acessível e consensual. Ao apresentá-lo dessa forma, seus proponentes apagam formas alternativas de conhecer e agir, privilegiando uma visão de mundo bastante específica, de um grupo com características particulares que é a comunidade da IA.

O saber representado e incluído no projeto é construído na expectativa de ser corriqueiro e não-problemático. Essa situação, e o fato de que os sujeitos participantes no empreendimento compartilham um envolvimento com a comunidade que lhe dá suporte, tornam de certa maneira opaca sua filiação, e menos visível a maneira em que é específico. Por esse motivo propomos interrogar esse saber, e tornar observáveis as marcas de sua origem e dos pressupostos que o orientam. Esse questionamento é importante na medida em que as marcas e pressupostos que observamos são compartilhados por uma série de outras realizações tecnológicas computacionais cuja funcionalidade e eficiência também são naturalizadas e tornadas opacas.

Estamos considerando aqui uma linha específica – a de sistemas especialistas, ou sistemas baseados em conhecimento – dentro de uma área científico-tecnológica mais ampla, a IA (que inclui a, mas não se limita à, tradicional IA simbólico-lógica). É uma abordagem estabelecida já há algum tempo, desde a década de 1970, que permanece relevante na medida em que continua sendo, atualmente, a escolha adequada para basear o projeto de inúmeros sistemas de informação computacionais, tendo recebido nesse meio tempo inúmeros aportes teóricos e tecnológicos. Colocamos aqui sob escrutínio uma realização específica, um artefato tecnológico em particular, um sistema especialista de senso comum. O objetivo foi mostrar como alegações a respeito de generalidade e universalidade de conhecimento e eficácia tecnológica são constituídos, em um complexo jogo que vai desde premissas epistemológicas fortes e não explicitadas até a apresentação do sistema computacional de maneira a ressaltar a obviedade do "universal" e a apagar o "particular" e a vinculação do artefato a realidades peculiares dos sujeitos conhecedores e construtores. Consideramos essa análise pertinente, na medida em que outras situações semelhantes, isto é, de apagamento de multiplicidades epistemológicas ligadas ao poder de construir tecnologias eficazes, podem ser identificadas tanto dentro das diversas linhas da IA como em outras áreas de realização técnico-científica.

O esforço devotado ao desenvolvimento de CYC reverbera dentro da área da computação e da inteligência artificial, assim como em outras áreas tais como a filosofia, a antropologia e os estudos de ciência e tecnologia, em função das características peculiares do projeto. São características que ancoram mutuamente questões de epistemologia, tecnologia avançada, atributos humanos privilegiados em nossa cultura tais como inteligência e agência, além de fortes – mesmo que implícitas – ressonâncias políticas e de poder relacionadas a regimes de saber. Essa situação faz da produção tecnológica da IA um campo de interesse, no qual é possível observar a materialização de formas específicas de compreender o sujeito e o conhecimento, e não apenas realizações de características humanas consideradas genéricas ou "universais".

  • ADAM, A. Artificial knowing: gender and the thinking machine Florence: Routledge, 1998.
  • ARNAIZ, M. G. Nutritional discourse in food advertising: between persuasion and cacophony. Anthropology of Food, 0, 2001. Disponível em: <http://aof.revues.org/index989.html>. Acesso em : 22 jan. 2011.
  • COLLINS, H. M. Artificial experts: social knowledge and intelligent machines Cambridge: MIT Press, 1990.
  • CYC. Concept: "work". Disponível em: <http://sw.opencyc.org/concept/Mx4rvVjhIpwpEbGdrcN5Y29ycA>. Acesso em : 02 fev. 2011.
  • DOUGLAS, M. Deciphering a meal. Daedalus, 101, 1, p. 61-81, 1972.
  • DREYFUS, H. L. Michel Foucault: beyond structuralism and hermeneutics 2. ed. Chicago: University of Chicago Press, 1983.
  • FORSYTHE, D. E. Engineering knowledge: the construction of knowledge in artificial intelligence. Social Studies of Science, 23, 3, p. 445-77, 1993.
  • GOODWIN, C. Professional vision. American Anthropologist, 96, 3, p. 606, 1994.
  • GOOGLE TECHTALKS. Computers versus common sense, 2006. Disponível em: <http://video.google.com/videoplay?docid=-7704388615049492068#>. Acesso em 02 fev. 2011.
  • GUHA, R. V. & LENAT, D. CYC: A midterm report. AI Magazine, 8, p. 32-59, 1990. Disponível em: <http://www.cyc.com/doc/articles/midterm_report_1990.pdf>. Acesso em: 22 jan 2011.
  • HARMON, P. Expert systems: artificial intelligence in business New York : Wiley, 1985.
  • INTERRANTE, J. The road to autopia: the automobile and the spatial transformation of the american culture. In: LEWIS, D. L. & GOLDSTEIN, L. (Ed.). The automobile and American culture. Chicago: University of Michigan Press, 1983. p. 89-104.
  • KARMILOFF-SMITH, A. & INHELDER, B. If you want to get ahead, get a theory. Cognition, 3, 3, p. 195-212, 1975.
  • LEWIS, D. L. & GOLDSTEIN, L. (Ed.). The automobile and American culture Chicago: University of Michigan Press, 1983.
  • LI, D. Artificial intelligence with uncertainty Boca Raton: Chapman & Hall/CRC, 2008.
  • LUGER, G. F. Artificial intelligence:structures and strategies for complex problem solving Boston: Addison-Wesley, 2002.
  • MATURANA, H. & VARELA, F. A árvore do conhecimento: as bases biológicas da compreensão humana Tradução H. Mariotti & L. Diskin. São Paulo: Palas Athena, 2001.
  • MCCARTHY, J. Some expert systems need common sense. Annals of the New York Academy of Sciences, 426, p. 129-37,1984.
  • NAPHADE, M. et al. Large-scale concept ontology for multimedia. IEEE MultiMedia, 13, 3, p. 86-91, 2006.
  • PANTON, K. et al. Common sense reasoning: from CYC to intelligent assistant. Lecture Notes in Computer Science, 3864, p. 1, 2006.
  • RUSSELL, S. J. & NORVIG, P. Artificial intelligence: a modern approach Englewood Cliffs: Prentice Hall, 1995.
  • SHAPIN, S. Leviathan and the air-pump: Hobbes, Boyle, and the experimental life Princeton: Princeton University Press, 1985.
  • STEELS, L. & BROOKS, R. A. (Ed.). The artificial life route to artificial intelligence: building embodied, situated agents Hillsdale: Lawrence Erlbaum, 1995.
  • TAYLOR, M. E. et al. Autonomous classification of knowledge into an ontology. Proceedings of the Twentieth International FLAIRS Conference, p. 140-5, 2007.
  • TURING, A. M. Computing machinery and intelligence. Mind, 236, p. 433-60, 1950.
  • WIENER, N. Cibernética: ou controle e comunicação no animal e na máquina Tradução G. K. Ghinzberg. São Paulo: Polígono/Edusp, 1970.
  • WITBROCK, M. et al. Knowledge begets knowledge: steps towards assisted knowledge acquisition in CYC. Proccedings of the AAAI 2005 Spring Symposium on Knowledge Collection from Volunteer Contributors Disponível em: <http://www.cyc.com/doc/white_papers/AAAI05-symposium-KCVC.pdf>. Acesso em: 22 jan. 2011.
  • 1
    Chamado de
    FACTory, em
  • 2
  • Datas de Publicação

    • Publicação nesta coleção
      29 Ago 2011
    • Data do Fascículo
      2011
    Universidade de São Paulo, Departamento de Filosofia Rua Santa Rosa Júnior, 83/102, 05579-010 - São Paulo - SP Brasil, Tel./FAX: (11) 3726-4435 - São Paulo - SP - Brazil
    E-mail: secretaria@scientiaestudia.org.br