Revista Tesseract www.tesseract.psc.br
ISSN 1519-2415
A COGNIÇÃO E AS DUAS TRADIÇÕES EM INTELIGÊNCIA ARTIFICIAL
Maria Elisa Marchini Sayeg
Doutora em Educação pela USP
cognitive@uol.com.br
Tanto a Inteligência Artificial Tradicional quanto o Conexionismo (também denominado Redes Neurais ou PDP - Processamento Paralelo Distribuído) oferecem metáforas interessantes que são usadas para a compreensão da cognição e do problema do significado em lingüística.
A Inteligência Artificial Tradicional
O computador serial é essencialmente uma máquina que manipula símbolos: recebe símbolos individuais (ou uma seqüência de símbolos) como input, aplica alguns algoritmos armazenados (o programa) ao input, e produz símbolos como output. Apenas um processamento do algoritmo é feito por vez, o que implica que existe uma ordem hierárquica de resolução (seqüências preferenciais ou necessárias para atingir o resultado final). Esse tipo de programa de computador inspirou uma determinada maneira de conceber a cognição, que Lakoff (1987, pp. xii - xiii) denomina "objetivismo", e propugna idéias tais como (os trechos em itálico são citações literais):
- o pensamento é manipulação de símbolos abstratos (ou proposições), que são entidades discretas (conforme Bates e Elmann (1992), não existe algo como 99% de uma letra A, ou 25% do número 7 como input; e também não existe caso em que um input não é nem claramente A nem claramente B, mas algo entre os dois).
- baseando-se na distinção entre software e hardware, diz-se que a mente é independente do substrato orgânico; é uma entidade abstrata, que manipula símbolos através de algoritmos, como um programa (software). Trata-se de uma interpretação falha, pois os símbolos manipulados não têm significado para o computador. Este é um modelo em que há sintaxe, mas não há semântica, como mostrou Searle no exemplo do Aposento Chinês.
- os símbolos adquirem seu significado através de correspondência com coisas do mundo externo, ou seja, trata-se de uma concepção referencialista, vericondicional do significado.
- os símbolos abstratos apresentam correspondência a coisas no mundo independentemente das propriedades particulares dos organismos;
- o pensamento é abstrato e não incorporado, independente das limitações do corpo humano, do sistema perceptual, e do sistema nervoso. Existe claramente uma divisão entre conceitual (o pensamento) e perceptual (relativo a restrições orgânicas, com propensão ao erro).
- o pensamento é atomístico, e pode ser decomposto em "blocos constitutivos" - os símbolos usados no pensamento - que são combinados de formas complexas e manipulados por uma regra.
- o pensamento é lógico (no sentido técnico termo).
Um modelo lingüístico que se aproxima desse modo de entender a cognição é o modelo combinatório (segundo Lahav, 1993, p. 71). Para o modelo combinatório, a atividade cognitiva manipula representações (conceitos, proposições, seqüências de fonemas) em etapas discretas e de acordo com critérios definidos. O procedimento seqüencial ocorre pela "quebra" de itens semânticos ou sintáticos compostos (proposições ou sentenças) em seus constituintes (conceitos, palavras, etc.), ou então no sentido inverso, combinando os constituintes em itens compostos. Essa abordagem proposicionalista, combinatória, do significado tem em Fodor e em Pylyshyn defensores de renome. As teorias de análise componencial de Katz e Fodor (1963) e Weinreich (1966) também se valem do modo de compreensão de cognição e linguagem adotado pela Inteligência Artificial tradicional.
H. Dreyfus faz importantes críticas à pretensão de certos teóricos de IA tradicional de que o computador pudesse pensar como um ser humano. Essas críticas mostram também os limites da IA tradicional como modelo para a cognição, ainda que não se afirme que o computador seja capaz de pensar:
"O computador vem ao nosso mundo ainda mais alienígena que um Marciano. Ele não tem corpo, necessidades ou emoções, e não é formado através de uma linguagem partilhada ou outras práticas sociais". (apud Clark, 1991, p. 25).
Dessa forma, o computador nunca entenderia o que é "cadeira", por exemplo:
"O que faz de um objeto uma cadeira é sua função e seu lugar em um contexto prático. Isso pressupõe certos fatos a respeito dos seres humanos (fadiga; o modo como o corpo se dobra) e uma rede de outros elementos culturalmente determinados (mesas, chão, abajures) e atividades (comer, escrever, ir a conferências, dar palestras, etc.). Além disso, entender "cadeiras" ainda envolve habilidades sociais tais como ser capaz de sentar apropriadamente em jantares, entrevistas, no trabalho". (apud Clark, 1991, p. 26).
Esses comentários enfatizam o papel do corpo humano e de uma formação social e cultural lenta, nossa "compreensão lentamente adquirida e contextualizada".
Segundo Clark (1991), no entanto, a importância do substrato biológico está em que ele fornece "variabilidade estrutural", algo que os modelos conexionistas são aparentemente capazes de oferecer, e portanto superam muitas das limitações da IA tradicional.
Conexionismo (Redes Neurais ou Processamento Paralelo Distribuído)
Segundo Rastier (1991, p. 39), para a tradição conexionista "cognitivo é termo usado para toda interação complexa de um organismo com seu meio, e não apenas para a atividade mental dita superior". Diferentemente da abordagem anterior, o conhecimento não é entendido como representação, e não é necessariamente consciente, acessível ou "conceitual"; fala-se freqüentemente num nível "subconceitual". A cognição (inclusive a linguagem) não é necessariamente manipulação de símbolos, e alguns modelos conexionistas são descritos como "subsimbólicos".
As redes conexionistas são usadas prioritariamente para modelizar fenômenos relativos à percepção, em que se atribui grande importância ao contexto (no sentido não lingüístico do termo) espacial, temporal, intencional. Mas são usadas também para modelizar fenômenos lingüísticos, como o significado semântico/pragmático. Uma vez que se tratam de redes conexionistas nos dois casos - modelos para a percepção e modelos para o significado - a distinção entre "pensamento" e percepção não é acentuada como era para o cognitivismo ortodoxo, associado à tradição da Inteligência Artificial tradicional.
O conexionismo inspira-se na estrutura cerebral, e desse modo abre um campo de cooperação importante entre a Inteligência Artificial e a Neurociência. A estrutura básica de um sistema conexionista compreende várias "unidades" ligadas entre si por relações de excitação e inibição com pesos ajustáveis. A inspiração neuronal é clara:
input unidade output
axônio corpo do neurônio dendritos
As várias conexões em paralelo reproduzem as conexões sinápticas. No entanto, segundo Clark (1991, P. 94), o "neurônio" conexionista é uma grande simplificação, uma vez que os neurônios e sinapses no cérebro são de diferentes tipos, com propriedades e complexidades de interconexão até agora intocadas pelos modelos conexionistas. Além disso, Rastier (1991, p. 43) critica o conexionismo por negligenciar totalmente o cérebro hormonal, cuja atividade não pode ser reduzida à propagação de sinais elétricos.
A atividade cognitiva, segundo o modelo conexionista, consiste numa propagação de ativações paralelas, ao invés de procedimentos seqüenciais combinatórios. Não existem representações discretas, mas sim, a informação é distribuída por toda rede, que pode apresentar padrões de ativação diferentes. Isso permite maior fluidez nas "representações", e reproduz certas vantagens do funcionamento cerebral, tais como "graceful degradation" (o sistema pode perder parte das unidades e mesmo assim funcionar) e tolerância a erros (mesmo com erros no input pode chegar a um resultado correto ou aproximado).
A "aprendizagem" de um sistema conexionista é uma mudança estrutural, e não algo guiado passo a passo e "de fora" (por um programador) como na IA tradicional. O sistema apresenta reorganizações que não foram determinadas nem previstas pelo "programador" (isto é, pelo ajuste inicial de pesos e ligações entre as unidades). Portanto, o sistema pode funcionar de maneiras imprevisíveis, e é capaz de produzir outputs realmente novos.
Numa rede conexionista a distinção entre software e hardware não se mantém, uma vez que não há programa com instruções passo a passo, independente do substrato físico, e sim ajustes no nível das unidades. Dessa forma, a concepção do cognitivismo tradicional, de "pensamento" ou de "mente" como uma entidade abstrata, independente de restrições físicas, é abandonada em favor de uma concepção do pensamento "incorporado" num organismo que se desenvolveu em um determinado ambiente, o que aproxima o pensamento da percepção. Essa mudança de abordagem está presente em teorias semânticas mais recentes, como as de Lakoff (1987) e de Rastier (1991).
Especificamente o conexionismo subsimbólico é considerado por Ramsey, Stich e Garan (1990) como uma teoria ontologicamente revolucionária, que supera o proposicionalismo modularista em psicologia (e em redes semânticas). Nesse tipo de modelo conexionista, a informação é altamente distribuída e não localizada. Em alguns modelos conexionistas ainda é possível ter algumas unidades individuais ou conjuntos pequenos de unidades que são concebidos como representações de propriedades específicas ou características do ambiente (como os schemata conexionistas de Rumelhardt et alli, 1988). Nesses modelos, quando a conexão de uma unidade com outra é forte, interpreta-se como se o sistema representasse a proposição seguinte: quando a característica representada pela primeira unidade está presente, a característica representada pela segunda unidade também estará. No entanto, em redes conexionistas subsimbólicas não é possível localizar representações proposicionais fora do nível do input. Não há características particulares ou estados do sistema que se prestam diretamente a uma interpretação semântica. Nenhuma unidade ou coleção de unidades representa uma característica específica do ambiente de modo imediato. Embora seja plausível ver tais redes como se coletiva ou holisticamente representassem proposições (e nesse sentido são consideradas simbólicas por Fodor e por Pylyshyn), nenhuma das unidades ocultas, ou seus pesos e desvios, podem ser confortavelmente entendidos como símbolos. Isto é, não são discretizáveis, atomicamente, como representações, e nesse sentido são como os semas, que só podem ser entendidos em meio a relações diferenciais.
Maria Elisa Marchini Sayeg
Doutora em Educação pela USP
cognitive@uol.com.br
Revista Tesseract
ISSN 1519-2415
www.tesseract.psc.br
Edição 5 - julho 2001