O XVII Colóquio da Lusofonia começa hoje em São Miguel, nos Açores, e decorre até dia 3 de Abril.
As sessões são abertas ao público e irão debater temas como lusofonia, literatura, ensino, formação, língua portuguesa no mundo e estudos de tradução, nomeadamente de e para português.
«Meu maior título de glória (quase ninguém sabe, você passa a ser dos poucos informados disso) é ter praticamente inventado a expressão paca, de curso, hoje, nacional. Está registrado no meu livro "Trinta anos de mim mesmo": publicado pela primeira vez no O Cruzeiro em 1957 (!). O Ziraldo me disse: "Essa não sai”. Saiu, e não aconteceu nada, porque pouca gente conhecia a palavra. Que, aliás, dizer a verdade, eu não inventei. Mas era, também, uma household word do meu grupo de meninos no Meyer. Tão usada que fazíamos variações (o cansaço traz, fatalmente, inovações linguísticas): paca, praca, páraca. Tudo maneira de eufemizar euforicamente o proibidíssimo, praticamente criminoso, na época: ”Pra caralho!” Hoje, com a permissividade, paca nem terá surgido: qualquer freira diz, sem ruborizar, a expressão-mãe.»
«Ninguém perguntou mas eu respondo. Sobre a nova ortografia. Pô, no meu tempo de vida já passei por quatro reformas. Durante mais de dez anos combati (ou escrevi irresponsavelmente, vocês decidem) os famigerados "sinais diacríticos diferenciais". Já enchi. Língua é a falada. A língua escrita, ortográfica, procura, mal e mal, registrar isso. Serve pra normatizar, encinar os burocratas a escrever serto.»
«Não sou nada. Nunca serei nada. Não posso querer ser nada. À parte isso, tenho em mim todos os sonhos do mundo. [...]» “Tabacaria”, Álvaro de Campos
«Fernando Pessoa para mim era um desconhecido. E o título [da colecção de poemas de Álvaro de Campos que Tabucchi adquiriu em Paris] era “Tabacaria” [...] E o poema tocou-me tanto, impressionou-me tanto, que eu pensei, bom, caramba, se há uma pessoa no mundo que escreveu um poema assim, eu quero aprender essa língua.»
Tal como aconteceu em 2011, a Priberam patrocina a segunda edição da Lisbon Machine Learning School (LxMLS), escola internacional de Verão sobre aprendizagem automática (“machine learning”, em inglês), que irá decorrer em Lisboa, no Instituto Superior Técnico, entre 19 e 25 de Julho.
Organizada conjuntamente pelo Instituto Superior Técnico, pelo Instituto de Telecomunicações e pelo Spoken Language Systems Lab - L2F do INESC-ID, a LxMLS 2012 irá debruçar-se sobre vários tópicos de aprendizagem automática, teóricos e práticos, importantes na resolução de problemas de processamento automático da língua inerentes à análise e ao uso de dados a partir da Web. Em particular, neste ano será dada especial atenção às aplicações relacionadas com redes sociais, como sejam a análise de sentimentos, a mineração de opiniões e a análise de grafos sociais.
A escola destina-se a estudantes, investigadores e profissionais das áreas de aprendizagem automática, linguística computacional, processamento automático da língua, com ou sem formação avançada nestas áreas. Da lista de oradores fazem parte investigadores de renome internacional.
O prazo de candidatura para os interessados em participar na LxMLS 2012 termina a 15 de Abril.
Não outro galo, mas outro garnisé cantaria se o corrector ortográfico do FLiP tivesse sido usado no seguinte texto de opinião, publicado hoje no jornal Diário de Notícias:
(In “Os garnizés [sic]”, Diário de Notícias, consultado em 14-03-2012)
Priberam Machine Learning Lunch Seminar Speaker: Ramon Astudillo (INESC-ID) Venue: IST Alameda, Sala PA2 (Edifício de Pós-Graduação) Date: Tuesday, March 6th, 2012 Time: 13:00 Lunch will be provided
Title: Integration of Fourier Domain Speech Enhancement and Automatic Speech Recognition through Uncertainty Propagation
Abstract: Speech enhancement techniques aim to recover the original clean signal underlying corrupted speech. Such techniques typically operate in the short-time Fourier transform (STFT) domain where phenomena like additivity of background noises, interfering speakers and echoes are easier to model. By contrast, automatic speech recognition (ASR), and in general most speech-related machine learning applications, operate on feature spaces that are non-linear transformations of the STFT. The reason for this is that such spaces provide a more compact representation of the acoustic space, the space of all acoustic realizations for a given task, and thus lead to simpler models. This talk discusses the integration of STFT speech enhancement and ASR using the concept of uncertainty propagation and decoding. This will include conventional speech enhancement in STFT domain, its associated uncertainty and various closed-form solutions for propagation into domains suitable for ASR.
Na nuvem das palavras mais consultadas no Dicionário Priberam, encontrava-se esta semana a palavra cigano:
(imagem captada em 28-02-2012)
Uma busca na Internet revela a razão para a palavra cigano ser tão consultada: de acordo com a notícia publicada na página da Procuradoria Geral da República Brasileira, o Ministério Público Federal de Minas Gerais apresentou queixa contra a Editora Objetiva e o Instituto Antônio Houaiss por considerar que o Dicionário Houaiss contém expressões pejorativas e preconceituosas relativas aos ciganos:
«[...] “Ao se ler em um dicionário, por sinal extremamente bem conceituado, que a nomenclatura [sic] cigano significa aquele que trapaceia, velhaco, entre outras coisas do gênero, ainda que se deixe expresso que é uma linguagem pejorativa, ou, ainda, que se trata de acepções carregadas de preconceito ou xenofobia, fica claro o caráter discriminatório assumido pela publicação”, diz o procurador. [...] Para ele, o fato de as afirmações serem feitas por uma publicação, que, por sua própria natureza, encerra um sentido de verdade, agrava ainda mais a situação. “Ora, trata-se de um dicionário. As pessoas consultam-no para saber o significado de uma palavra. Ninguém duvida da veracidade do que ali encontra. Sequer questiona. Pelo contrário. Aquele sentido, extremamente pejorativo, será internalizado, levando à formação de uma postura interna pré-concebida [sic] em relação a uma etnia que deveria, por força de lei, ser respeitada”. [...]».
Como é possível que uma língua tenha palavras e acepções (como cigano, coninhas, fufa, galego, judeu, pretalhada ou rabeta) que podem insultar ou ofender? Deverá um dicionário registá-las?
Em resposta à última pergunta, a lexicografia actual assume que um dicionário deve seguir uma abordagem descritiva na selecção das palavras e na forma como as define, usando nomeadamente um conjunto de etiquetas ou sinais para assinalar níveis de língua (como linguagem informal ou calão) ou usos específicos (como expressões depreciativas ou insultuosas), não devendo o autor ou editor do dicionário impor a sua opinião sobre o uso da língua1.
Onde reside afinal o preconceito: nos falantes, que optam propositadamente por ofender com palavras, ou no dicionário, que descreve e indica o uso potencialmente ofensivo de determinados termos? Note-se que, como em muitos outros casos do género, o Dicionário Houaiss assinala as acepções que podem ser consideradas ofensivas com a indicação “pej.”, redução de “pejorativo”. O uso pejorativo é «[...] característico de palavras, expressões ou acepções que são (ou, na dependência do contexto, podem ser) grosseiras, ofensivas, ferinas ou preconceituosas [...]»2.
Ao alertar para termos e empregos preconceituosos, informais ou obscenos, muitas vezes desconhecidos dos falantes, seja porque pertencem a diferentes enquadramentos socioculturais, seja porque são falantes estrangeiros, os dicionários estão a alertar os consulentes para a possibilidade de usarem linguagem ofensiva ou de ferirem as susceptibilidades de outros falantes.
No entanto, nem sempre foi assim, como se pode comprovar consultando o verbete cigano num dicionário de língua portuguesa do início do século XX:
cigano,1 m. Aquelle que pertence á raça dos ciganos. Adj. Trapaceiro; ladino. M. pl. Povo errante e miserável, de procedencia indiana, que, fugindo á invasão mongólica, se distribuiu por todo o mundo, falando dialectos que são prácritos corrompidos, e empregando-se ora em enganar vendedores ou compradores de gados nas feiras, ora na pirataria, no acrobatismo, etc. (Al. zigeuner, russo tzigane).
(in Cândido de Figueiredo, Novo Dicionário da Língua Portuguesa, 1913, p. 444)
Um dicionário deve ser feito à medida de uma língua. E, do mesmo modo que não são os repórteres de guerra que fazem a guerra com as atrocidades, crimes e mortes que divulgam nas imagens que registam, não são os dicionários que fazem a língua, são os falantes, tenham eles a nacionalidade, etnia, religião, ideologia, orientação sexual, idade ou o género que tiverem.
Como a Priberam já teve oportunidade de explicar, relativamente a galego e às locuções sexo forte e sexo fraco, a função de um dicionário passa por uma descrição dos usos da língua, devendo basear-se essencialmente em factos linguísticos e não estabelecer juízos de valor relativamente a eles, antes apresentá-los o mais objectivamente possível.
Este não é, na língua portuguesa ou em qualquer outra língua, um caso único, pois as línguas, enquanto sistemas de comunicação, veiculam também os preconceitos da cultura em que se inserem, como também refere o comunicado disponibilizado na página do Instituto Antônio Houaiss:
«[...] Nenhum dicionário deve ocultar empregos preconceituosos de palavras quando se vê diante deles. Registramos precisamente o que encontramos, tanto dentro do padrão culto da língua como no informal. Os dicionários não inventam palavras nem acepções. Nesse espelho em que nos constituímos refletem-se a realidade da língua e os sentimentos dos seus falantes, ora com sua beleza e simpatia, ora com sua crueldade, com seus sentimentos e atitudes desfavoráveis para com minorias etc. Ninguém supõe eliminar dos dicionários palavras como guerra, tortura, violência, pedofilia com fim de conter ou impedir que tais tormentos continuem a existir. Fazê-lo seria apenas varrer para debaixo do tapete o que nos envergonha, mas isso não serve de ação preventiva nem eliminadora do mal que tais conceitos e outros preconceitos acarretam. Que fazer nos dicionários em tais casos, então? Registrar a palavra ou a acepção e dizer claramente, quando é o caso, que ela é pejorativa e preconceituosa. É como fazem os dicionários modernos em todo o mundo.»
1 Piet Swanepoel “Dictionary typologies: A pragmatic approach” in Piet van Sterkenburg (ed.), A Practical Guide to Lexicography, John Benjamins Publishing Company, Amsterdam/Philadelphia, 2003, p. 65. 2 Ver o tópico “Nível de uso” da secção “Detalhamento do verbete” em “Conhecendo o dicionário”, na Ajuda do Dicionário Eletrônico da Língua Portuguesa, versão 1.0.5a.