sexta-feira, 23 de dezembro de 2011
quinta-feira, 22 de dezembro de 2011
Últimas sobre o Acordo Ortográfico #2
Segundo o artigo publicado no passado dia 17 de Dezembro, apesar de, no geral, o clima de aceitação do AO nas escolas portuguesas ser morno, havendo aceitação e discordância q.b., persistem confusões. Uma delas é esta:
«Algumas bases são extremamente subjectivas”, diz [Edviges Ferreira, presidente da Associação de Professores de Português]. “Sobretudo no que diz respeito ao uso do ‘p’ e do ‘c’, em que, em muitos casos, a pessoa pode escrever conforme lhe apetecer. Se disser Egito escreve sem ‘p’, mas se disser Egipto escreve com ‘p’.
Mas depois o acordo contradiz-se.” E como faz para resolver essas contradições quando está a dar formação? “Explico isso, e aconselho os colegas a ensinar os meninos a escrever como dizem. Nesse caso, o professor não os pode penalizar”.»
Curiosamente, e como já aqui se explicou, a palavra Egito surge no texto legal do AO como um exemplo claro em que a consoante “p” não se pronuncia, pelo que não se trata de um caso de dupla grafia.
Outra confusão é a que diz respeito ao hífen de cor-de-rosa:
«Também Ana Soares diz que as dificuldades que têm surgido resultam de regras cuja lógica nem sempre é perceptível – por exemplo, o hífen, que deixa de existir em cor-de-rosa, mas não em cor-de-laranja [sic]. Curiosamente, é o mesmo exemplo que Fátima Gomes utiliza para lamentar que a questão da hifenização “tenha muitas excepções, e depois excepções dentro das excepções.”»
Contrariamente ao que é dito acima, à luz do novo AO, cor-de-rosa mantém o hífen mas cor-de-laranja perde-o (ver ponto 6.º da Base XV). Esta não é, porém, uma inovação do AO, pois tal incongruência – a escrita de cor-de-rosa com hífen mas de cor de laranja sem hífen – já acontecia na norma anterior (ver alínea b da Base XXVIII do Acordo Ortográfico de 1945 e Tratado de Ortografia da Língua Portuguesa, Coimbra, Atlântida, 1947, p. 202, n.º 2 e p. 243, n.º 4).
Aguarda-se que a publicação do Vocabulário Ortográfico Comum (previsto no art. 2.º do AO), recentemente anunciado para 2014, esclareça de vez estas e outras confusões.
Entretanto, com ou sem confusões, a adopção efectiva do AO na Assembleia da República e em todos os serviços, organismos e entidades dependentes do Governo, bem como no Diário da República, entra em vigor já a partir de 1 de Janeiro de 2012.
segunda-feira, 12 de dezembro de 2011
Mania de perseguição
«Perhaps the persecution complex is a phenomenon peculiar to Portuguese managers.
Jose Mourinho, by his perception of enemies in everybody from Pep Guardiola to the Barcelona groundsman, elevates mania de perseguicao [sic] to the realms of theatrical art.
But Andre Villas-Boas appears to have learned the same repertoire from his mentor.»
Depois de saudade e de desenrascanço, é a vez de a expressão mania de perseguição (ou mania da perseguição) ganhar destaque além-fronteiras. Segundo o referido jornal, trata-se de um fenómeno próprio dos treinadores portugueses...
segunda-feira, 5 de dezembro de 2011
LxMLS 2011 – vídeos
A LxMLS é uma escola internacional de Verão que inclui aulas, laboratórios e palestras sobre aprendizagem automática (“machine learning”). A escola destina-se a estudantes, investigadores e profissionais das áreas de linguística computacional e de aprendizagem automática.
Subordinada ao tema “Learning for the Web”, a LxMLS 2011 contou com mais de uma centena de participantes. A próxima edição está já em preparação. Mais informação, aqui.
quinta-feira, 17 de novembro de 2011
Inventário
O regime jurídico do processo de inventário foi aprovado pela Lei nº 29/2009, de 29 de Junho.
Entre as diversas previsões, consagrou-se a competência dos serviços de registos e cartórios notariais para a tramitação do processo de inventário, com o controlo geral de um juiz, com vista ao descongestionamento dos tribunais.
A referida lei no seu artigo 87º nº 1, na redacção originária, previa a entrada em vigor do indicado regime para o dia 18 de Janeiro de 2010, tendo sido prorrogada para o dia 18 de Julho do mesmo ano pela Lei nº 1/2010, de 15 de Janeiro.
Porém, a Lei nº 44/2010, de 3 de Setembro, veio alterar novamente essa norma dispondo que “A presente lei produz efeitos 90 dias após a publicação da portaria referida no nº 3 do artigo 2.º" .
Perante esta disposição legal verifica-se que o regime aprovado já entrou em vigor, mas ainda não produz efeitos, o mesmo é dizer, não é exequível.
Continua por publicar a referida portaria que virá regulamentar a tramitação processual do processo de inventário, pelo que se verifica uma lacuna legislativa grave. Muitos têm sido os esclarecimentos proferidos pelas entidades competentes nessa matéria, e inclusive já existe jurisprudência, designadamente o acórdão do Tribunal Constitucional – Acórdão 327/2011, de 20 de Setembro de 2011 – a definir que se mantém em vigor o regime anterior, pelo que os tribunais judiciais serão os competentes para receber o processo de inventário.
quinta-feira, 10 de novembro de 2011
Novos produtos da gama FLiP
Este corrector não possui a possibilidade de verificação ortográfica pré-Acordo nem inclui os dicionários temáticos e todas as outras ferramentas que fazem parte dos restantes produtos da gama FLiP.
Os novos produtos da gama FLiP já estão disponíveis na loja online da Priberam.
quarta-feira, 9 de novembro de 2011
O nome é Priberam, PRI-BE-RAM
1. O que é o Priberam® e para que é utilizado?1. O que é o Priberam® e para que é utilizado?
2. Antes de usar o Priberam®.
3. Como usar o Priberam®.
4. Efeitos secundários do Priberam®.
5. Apresentação.
6. Outras informações.
O Priberam® é o dicionário de língua portuguesa mais consultado na Internet, de acesso gratuito.
É um dicionário de português contemporâneo, com cerca de 105 000 entradas lexicais, que permite a consulta de definições, com sinónimos e antónimos por acepção. É também possível consultar informação sobre a origem de algumas palavras e a sua pronúncia.
O seu uso é recomendado no esclarecimento de dúvidas de natureza ortográfica, etimológica, semântica ou sintáctica em relação ao português.
2. Antes de usar o Priberam®.
Não há nenhum cuidado especial a ter antes de usar o Priberam®. No entanto, é aconselhável a leitura das secções “Sobre o Dicionário” e “Como consultar”.
O Priberam® pode afectar a forma como outros produtos actuam. Pode ocorrer uma interacção com:
- Os auxiliares de tradução de e para português, espanhol, francês ou inglês;
- O conjugador de verbos;
- A secção de dúvidas linguísticas.
3. Como usar o Priberam®.
Use e abuse, a qualquer hora do dia ou da noite.
4. Efeitos secundários do Priberam®.
O Priberam® pode alterar a forma como escreve.
O Priberam® é geralmente bem tolerado e não são conhecidos efeitos secundários indesejáveis. Em alguns casos, porém, foram observadas reacções de salutar dependência.
5. Apresentação.
O Priberam® apresenta-se sob a forma de uma página da Internet, de consulta gratuita.
O Priberam® apresenta-se também sob a forma de diversos suplementos, como widgets para o Mac OS X, gadgets para o Windows Vista e o Windows 7, fornecedores de pesquisa para o Internet Explorer e o Firefox, aplicações para o Android, o iPhone, o iPod Touch e o Windows Phone 7.
O Priberam® está também disponível sob a forma de ebook para o Kindle e de uma aplicação para Windows, que permitem a sua consulta sem necessidade de ligação à Internet.
6. Outras informações.
Priberam® é também o nome da empresa que disponibiliza o dicionário homónimo.
A Priberam é uma empresa especialista na concepção e desenvolvimento de software e conteúdos digitais, com produtos e serviços em quatro áreas distintas: processamento computacional da língua, sistemas de gestão de conhecimento jurídico, motores de pesquisa semânticos e saúde.
quinta-feira, 3 de novembro de 2011
Poesia trovadoresca galego-portuguesa online
Trata-se de uma base de dados online, de consulta gratuita, que reúne as 1680 cantigas medievais dos cancioneiros galego-portugueses e, sempre que disponíveis, as respectivas imagens dos manuscritos e a música (a medieval ou versões mais contemporâneas, através de ficheiros áudio).
Para além da informação sobre autores, personagens e lugares referidos nas cantigas, o texto editado fornece informações para facilitar o seu enquadramento histórico e interpretação, como glossário, notas explicativas ou notas de leitura.
Quanto à ortografia do texto editado, que pode ser confrontado com o texto original manuscrito, procedeu-se à normalização ortográfica, como se refere no ponto 3.3. Critérios ortográficos da secção de apresentação.
segunda-feira, 31 de outubro de 2011
Agenda: Homem de palavra[s]
No cinquentenário da publicação do seu primeiro livro de poemas, Aquele Grande Rio Eufrates (1961), o encontro pretende homenagear um dos principais nomes da poesia portuguesa da segunda metade do século XX, reunindo estudiosos da obra de Ruy Belo, especialistas em poesia portuguesa e em teoria e crítica literárias.
A entrada é gratuita (mas sujeita a inscrição) e o evento terá transmissão directa online. Mais informação, aqui.
sexta-feira, 21 de outubro de 2011
Num novo Kindle perto de si
Seis meses depois, uma parceria entre as duas empresas permite que o Dicionário Priberam da Língua Portuguesa surja incorporado na versão mais recente do Kindle. Desta forma, é possível consultar a definição de qualquer palavra portuguesa que apareça nos textos escritos em português, sejam eles escritos na variedade europeia ou brasileira.
segunda-feira, 10 de outubro de 2011
Uma forma diferente de começar a semana
terça-feira, 4 de outubro de 2011
Agenda: prémios da Casa de Portugal em Macau
Realiza-se amanhã, 5 de Outubro, a entrega dos prémios Casa de Portugal em Macau, que distinguem os melhores alunos do ensino macaense na disciplina de língua portuguesa.
A Priberam associa-se este ano ao evento, através do seu distribuidor em Macau, TechED, oferecendo uma licença do pacote de ferramentas de revisão e auxílio à escrita FLiP 8, a cada um dos premiados.
segunda-feira, 3 de outubro de 2011
Lusofonia é...
quinta-feira, 29 de setembro de 2011
Nova Ortografia – Modo de Usar
Trata-se de um guia resumido sobre o que muda com o novo Acordo Ortográfico da língua portuguesa. É de acesso gratuito e está disponível no site do FLiP, em formato PDF, para que qualquer pessoa o possa consultar, imprimir ou partilhar.
terça-feira, 27 de setembro de 2011
FLiP:mac na imprensa
“[...] No geral, é uma ferramenta indispensável a habitar no nosso computador. É leve no sistema, demonstra eficácia com a produção de resultados imediatos na escrita, tem um preço atractivo e pode ser adquirido e descarregado na loja online da Priberam.”
In i, n.º 747, 27 de Setembro de 2011, p. 15.
quinta-feira, 22 de setembro de 2011
Aniversário da Priberam prolonga promoção FLiP no Facebook: -50%
Para comemorar mais um aniversário e o facto de recentemente termos ultrapassado os 20 000 fãs na nossa página do Facebook, resolvemos prolongar a promoção de 50% de desconto na compra do FLiP 8, do FLiP:mac 3 e do FLiP:mac 3 Brasil na loja da Priberam.
O FLiP detecta e corrige erros ortográficos no Word e noutras aplicações, com ou sem o Acordo Ortográfico de 1990. É um programa informático que inclui ainda um conversor para a nova ortografia, um dicionário e um conjugador, entre outras ferramentas.
Até 25 de Setembro, dê a volta ao texto com esta promoção.
segunda-feira, 19 de setembro de 2011
Promoção FLiP no Facebook: -50%
Para agradecer a todos a preferência, as sugestões e os comentários, oferecemos aos nossos fãs um desconto de 50% na compra do FLiP e do FLiP:mac na nossa loja da Priberam.
O FLiP detecta e corrige erros ortográficos no Word e noutras aplicações, com ou sem o Acordo Ortográfico de 1990. É um programa informático que inclui ainda um conversor para a nova ortografia, um dicionário e um conjugador, entre outras ferramentas.
Até 21 de Setembro, dê a volta ao texto com esta promoção.
quinta-feira, 8 de setembro de 2011
Colóquios em Maputo
O encontro tem por objectivo a troca de experiências entre representantes de diversas organizações que se dedicam ao estudo e à gestão da pluralidade linguística da Comunidade dos Países de Língua Oficial Portuguesa (CPLP).
Estão programadas comunicações sobre política de língua, direitos linguísticos na legislação, oficialização de línguas minoritárias, ensino bilingue e plurilingue e formação de docentes para esses tipos de ensino.
O colóquio decorre de 12 a 14 de Setembro no Ministério de Educação moçambicano e o programa está disponível aqui.
No dia seguinte, 15 de Setembro, também em Maputo e ainda subordinado ao tema da pluralidade linguística, decorre o colóquio “Português em Contexto Africano Multilingue: em busca de consensos”, organizado pela Universidade Eduardo Mondlane e pelo Instituto Camões em Moçambique.
quinta-feira, 1 de setembro de 2011
Centenário da primeira reforma ortográfica em Portugal
Manda o Govêrno da República Portuguesa, pelo Ministro do Interior:
1.º Que o relatório da referida comissão seja publicado no Diário do Govêrno, devendo ser para o futuro adoptada em todas as escolas, e bem assim nos documentos e publicações oficiais, a ortografia proposta pela comissão;
2.º Que se dê a tolerância máxima de três anos, a contar da data da publicação da presente portaria, para a conservação das grafias existentes nos livros didácticos actualmente em uso, a fim de não prejudicar os respectivos autores ou editores;
3.º Que se promova a rápida organização e publicação, pelo preço mais módico possível, de um vocabulário ortográfico e de uma cartilha, especialmente destinada a vulgarizar e exemplificar o sistema de ortografia adoptado;
4.º Que a comissão nomeada por portaria de 15 de Fevereiro de 1911 continue em exercício pelo tempo que se julgar conveniente, a fim de ser ouvida sobre quaisquer dúvidas que se suscitem relativamente à execução da reforma proposta, podendo a referida comissão reùnir-se por iniciativa própria, ou convocada pela Direcção Geral da Instrução Secundária, Superior e Especial, por intermédio da qual serão feitas quaisquer reclamações sôbre o assunto.
Paços do Govêrno da República, em 1 de Setembro de 1911. O Ministro do Interior, António José de Almeida.»
É com este texto, publicado no Diário do Govêrno n.º 206, de 4 de Setembro de 1911, pág. 5-6, que se aprova o primeiro acto legislativo sobre a ortografia da língua portuguesa. De acordo com o chefe do gabinete de revisão da Imprensa Nacional de Lisboa na altura, a regulação da ortografia era premente uma vez que “tais variedades de grafias trazem para a Imprensa [Nacional] não só descrédito mas também prejuízos pecuniários”, pois as emendas que eram necessárias fazer aquando da transição para outras publicações periódicas, “além de estabelecerem confusão no espírito do compositor, avolumam de uma maneira assombrosa a despesa da composição, e impedem a rapidez da impressão” (p. 3).
Na base desta portaria estão as Bases da Ortografia Portuguesa, obra escrita em 1885 pelo romanista Gonçalves Viana e pelo orientalista Vasconcelos Abreu.
Cem anos e algumas reformas ortográficas depois, com as consequentes discussões académicas (e não tão académicas), inúmeras interpretações e muita polémica, confirma-se que a questão da ortografia continua a ser “um dos capítulos mais atormentados da história linguística portuguesa”, como escreve Giuseppe Tavani em A Demanda da Ortografia Portuguesa (Lisboa: Edições João Sá da Costa, 1987, p. 201). Será que vai continuar a sê-lo nos próximos cem anos?
segunda-feira, 22 de agosto de 2011
Sobre a grafia do nome do líder líbio
Na imprensa portuguesa, hoje mesmo é possível encontrar Kadhafi (como escrevem os jornais Diário de Notícias, Expresso, i, Sol e Correio da Manhã), Khadafi (como escrevem o Público e o Jornal de Negócios) ou Kadafi (como escreve o Jornal de Notícias). A diferença é mínima – só muda o lugar ou a presença da letra h – e resulta da transliteração do árabe.
De acordo com Nadia Bentahar, formadora de árabe no Centro de Línguas da Faculdade de Letras da Universidade de Lisboa e tradutora, o nome do líder líbio, em árabe, escreve-se القذافي.Transcrito foneticamente, à maneira do árabe clássico, obtém-se Al-Qaḏâfî. Ora, na passagem da transcrição fonética para a transliteração surgem alguns problemas:
1. O som árabe Q (ficheiro de som) é transcrito por vezes como K, Kh ou Q, não havendo uma transcrição consensual entre os países de tradição francófona e os de tradição anglo-saxónica.
2. Os líbios pronunciam o som árabe Q como G e por isso as pronúncias mais próximas do dialecto da Líbia são Algathafi (transliteração anglo-saxónica) ou El-Gueddafi (transliteração francófona). No entanto, estas formas não têm muita visibilidade fora da Líbia e da zona do Magrebe.
3. O artigo al- em Al-Qaḏâfî foi omitido muitas vezes nas transliterações da imprensa internacional e assim surgiram grafias como Khadafi ou Gueddafi.
Na imprensa brasileira também ocorre variação, mas, tal como em Portugal, ela não é tão grande quanto em inglês, língua que regista várias grafias possíveis para este mesmo nome.
Seja qual for a grafia, Khadafi, Kadhafi ou Kadafi, dificilmente algum falante de português consegue distingui-las na pronúncia. Por isso, e na ausência de uma grafia oficial, deve fazer-se um esforço para manter a coerência, optando por uma só grafia no mesmo texto ou documento.
sexta-feira, 5 de agosto de 2011
Lusofonia é...
quinta-feira, 4 de agosto de 2011
Num Windows perto de si
Trata-se de uma aplicação para Microsoft Windows que permite a consulta do Dicionário Priberam sem necessidade de ligação à Internet, possibilitando o uso da ortografia com ou sem o Acordo Ortográfico de 1990 e a selecção entre a variedade de português de Portugal ou do Brasil. Mais informações, aqui.
sexta-feira, 29 de julho de 2011
Herrar é umano, mas é pouco profissional
A baixa tolerância de muitos leitores a inconsistências, gralhas e erros ortográficos e gramaticais reflecte-se nos comentários e críticas rapidamente disponíveis online. Por essa razão, justifica-se uma maior atenção ao trabalho de edição e revisão por parte dos jornais.
Em Portugal, as publicações Expresso, Visão, Jornal de Letras, Público, A Bola, Record, Correio da Manhã, Jornal de Notícias, Jornal i e Diário da República, entre outras, contam com a tecnologia FLiP, o pacote de ferramentas linguísticas da Priberam, para ajudar na tarefa de revisão e correcção de texto. No Brasil, o mesmo sucede com os jornais O Estado de S. Paulo e a Folha de S. Paulo.
O FLiP permite a correcção ortográfica, sintáctica e estilística na variedade europeia e na variedade brasileira do português, com ou sem o Acordo Ortográfico de 1990. Encontra-se integrado em dezenas de aplicações, entre as quais se contam os sistemas utilizados nas redacções dos jornais acima referidos.
Seja qual for a opção, quem quer escrever bem usa o FLiP, porque “herrar” pode ser “umano”, mas não é profissional.
sexta-feira, 15 de julho de 2011
Lusofonia é...
A nova versão do DPLP já está disponível online. O trabalho de adaptação do conteúdo, do software e da interface do DPLP permite agora a consulta numa das duas normas, além de se manter a possibilidade de visualizar o conteúdo na grafia pré ou pós-Acordo Ortográfico:
quarta-feira, 13 de julho de 2011
Lisbon Machine Learning School
É já para a semana!
terça-feira, 12 de julho de 2011
Não há santo que valha
segunda-feira, 11 de julho de 2011
Rock in Law 2011 - não à crise
- Presença de 2300 pessoas: 40% acima do número de participantes no Rock in Law 2010;
- Angariação de fundos: o evento angariou 98 402€, sendo que, deduzindo os respectivos custos, vai ser possível contribuir com 73 103€ para a criação da nova Casa dos Rapazes e para a melhoria das instalações da APPDA –Lisboa;
- Todos os patrocinadores que se associaram ao evento contribuíram em muito para este sucesso, donde destaco a participação da Priberam pelo terceiro ano consecutivo.
Está, pois, bem demonstrado que em tempos difíceis a união por causas sociais faz ainda mais sentido. Se pudermos contar com a "música dos advogados", tanto melhor!
quarta-feira, 6 de julho de 2011
Agenda: Festa Literária Internacional de Paraty 2011
O FLiP, pacote de ferramentas linguísticas da Priberam para auxiliar na escrita em língua portuguesa, não está sozinho no mundo dos acrónimos. Do outro lado do Atlântico chega-nos a Flip, Festa Literária Internacional de Paraty, no estado do Rio de Janeiro.
A 9.ª edição da Flip, que tem hoje início e que decorre até 10 de Julho, conta com a participação de vários autores nacionais e internacionais e tem na agenda conferências, exposições, oficinas, exibições de filmes e outros eventos, sem descurar a programação destinada aos mais jovens. Mais informações, aqui.
terça-feira, 5 de julho de 2011
Má-língua?
segunda-feira, 4 de julho de 2011
Rock in Law 2011
Aguarda-se que o propósito deste evento de cariz social – construção da nova Casa dos Rapazes e recuperação das instalações da Associação Portuguesa para as Perturbações do Desenvolvimento e Autismo - tenha sido amplamente alcançado.
O Rock in Law veio para ficar!
sexta-feira, 1 de julho de 2011
FLiP:mac 3 e FLiP:mac 3 Brasil
O FLiP:mac 3 compreende um corrector ortográfico, nove dicionários temáticos, um dicionário de sinónimos, um hifenizador para o português europeu e permite seleccionar variedades do português de Angola, Cabo Verde, Galiza, Guiné-Bissau, Macau, Moçambique, São Tomé e Timor.
Ambas as versões permitem escrever de acordo com as regras do Acordo Ortográfico de 1990 ou com as regras anteriormente em vigor e são compatíveis com o Apple Mac OS X versão 10.5 (Leopard), versão 10.6 (Snow Leopard) ou versão 10.7 (Lion)*, com o Microsoft Office 2008 e 2011 e com todas as aplicações que recorram ao corrector ortográfico de sistema para verificarem os textos, tais como o editor de texto de sistema, o Safari, o OpenOffice.org e aplicações do iWork como o Pages ou o Keynote.
quarta-feira, 29 de junho de 2011
Muda-se o Governo, mantém-se o Acordo Ortográfico
O intuito do novo Governo português é confirmado pelas palavras do Secretário de Estado da Cultura, Francisco José Viegas, em declarações publicadas hoje no Diário Digital: “O acordo ortográfico é uma nova norma do acordo a que se chegou e é para ser implementado. Vamos prosseguir o trabalho de implementação porque é um caminho sem retorno.”
Mantêm-se assim as disposições e as datas (ver aqui) previstas pelo anterior Governo para a aplicação do novo Acordo Ortográfico em organismos e serviços governamentais portugueses.
terça-feira, 28 de junho de 2011
Rock in Law 2011
A terceira edição do Rock in Law irá decorrer nos Meninos do Rio, em Lisboa, no próximo dia 30 de Junho, às 21 horas. Para mais informações consulte https://www.facebook.com/event.php?eid=100878170001635
As receitas do Rock in Law 2011 reverterão para a construção da nova Casa dos Rapazes e para a recuperação das instalações da Associação Portuguesa para as Perturbações do Desenvolvimento e Autismo.
sexta-feira, 24 de junho de 2011
Acordo Ortográfico no Jornal Oficial da União Europeia
Tal como aqui já tinha sido referido, Janeiro de 2012 é a data para o início da aplicação do novo Acordo Ortográfico ao Diário da República, o jornal oficial da República Portuguesa, e aos restantes organismos e serviços governamentais portugueses.
segunda-feira, 30 de maio de 2011
Priberam Machine Learning Lunch Seminar
Priberam Machine Learning Lunch Seminar
Speaker: João Graça (L2F @INESC-ID)
Venue: IST Alameda, Sala PA2 (Pavilhão de Pós-Graduação)
Date: Tuesday, May 31st, 2011
Time: 13:00
Lunch will be provided
Title: Rich Prior Knowledge in Learning for Natural Language Processing
Abstract:
We possess a wealth of prior knowledge about most prediction problems,
and particularly so for many of the fundamental tasks in natural
language processing. Unfortunately, it is often difficult to make
use of this type of information during learning, as it typically does
not come in the form of labeled examples, may be difficult to encode
as a prior on parameters in a Bayesian setting, and may be impossible
to incorporate into a tractable model. Instead, we usually have prior
knowledge about the values of output variables. For example, linguistic
knowledge or an out-of-domain parser may provide the locations of
likely syntactic dependencies for grammar induction. Motivated by
the prospect of being able to naturally leverage such knowledge, four
different groups have recently developed similar, general frameworks
for expressing and learning with side information about output variables.
These frameworks are Constraint-Driven Learning (UIUC), Posterior
Regularization (UPenn), Generalized Expectation Criteria (UMass Amherst),
and Learning from Measurements (UC Berkley).
This tutorial describes how to encode side information about output
variables, and how to leverage this encoding and an unannotated
corpus during learning. We survey the different frameworks, explaining
how they are connected and the trade-offs between them. We also survey
several applications that have been explored in the literature,
including applications to grammar and part-of-speech induction, word
alignment, information extraction, text classification, and multi-view
learning. Prior knowledge used in these applications ranges from
structural information that cannot be efficiently encoded in the model,
to knowledge about the approximate expectations of some features, to
knowledge of some incomplete and noisy labellings. These applications
also address several different problem settings, including unsupervised,
lightly supervised, and semi-supervised learning, and utilize both
generative and discriminative models. The diversity of tasks, types of
prior knowledge, and problem settings explored demonstrate the generality
of these approaches, and suggest that they will become an important tool
for researchers in natural language processing.
The tutorial will provide the audience with the theoretical background to
understand why these methods have been so effective, as well as practical
guidance on how to apply them. Specifically, we discuss issues that come
up in implementation, and describe a toolkit that provides "out-of-the-box"
support for the applications described in the tutorial, and is extensible
to other applications and new types of prior knowledge.
--
Bio: Joao Graca is a post doctoral researcher at the L2F Inesc-ID.
He obtained his PhD in Computer Science Engineering at Instituto Superior Tecnico, Technical University of Lisbon, where he was advised jointly by Luisa Coheur, Fernando Pereira and Ben Taskar. His main research interest are Machine Learning and Natural Language Processing. Currently his research focus on unsupervised learning with high level supervision in the form of domain specific prior knowledge, and on the utility of unsupervised methods for real world applications.
Palavras da semana
quinta-feira, 26 de maio de 2011
Agenda: Feira do livro do Porto 2011
A 81.ª edição deste certame literário é organizada pela Associação Portuguesa de Editores e Livreiros (APEL) e prevê a realização de debates, apresentações, lançamentos e sessões de autógrafos.
Tal como na passada Feira do Livro de Lisboa, na agenda de debates não há qualquer referência à forma como o Acordo Ortográfico está ou não a ser adoptado pelas editoras.
segunda-feira, 23 de maio de 2011
Quando um erro não vem só...
Palavras da semana
segunda-feira, 16 de maio de 2011
Priberam Machine Learning Lunch Seminars
Priberam Machine Learning Lunch Seminar
Speaker: José Santos (Microsoft)
Venue: IST Alameda, Sala EA2 (Torre Norte)
Date: Tuesday, May 17th, 2011
Time: 13:00
Lunch will be provided
Title: Inductive Logic Programming applied to Bioinformatics
Abstract:
Inductive Logic Programming (ILP) is a Machine Learning approach with foundations in Logic Programming. The problem specification and the models discovered by ILP systems are both represented as Prolog programs allowing for great expressiveness and flexibility. However, this flexibility comes at a high computational cost and ILP systems are known for their difficulty in scaling-up. Constructing and evaluating complex concepts are two of the main problems that prevent ILP systems from tackling many of the most interesting learning problems. Large concepts cannot be constructed or evaluated simply by parallelizing existing top-down search algorithms or improving the underlying Prolog engine. Novel search strategies and cover algorithms are needed. The main focus of this talk is on how to efficiently construct and evaluate such complex hypotheses in an ILP setting. Namely, we will present an efficient theta-subsumption algorithm that improves over Prolog's SLD-resolution by several orders of magnitude. We will also show how a new bottom-up search strategy coupled with this efficient subsumption algorithm led to the discovery of a better model for a protein-binding application problem.
--
Bio: José Santos has a Ph.D. degree in Computer Science (2010) from Imperial College London. In the Ph.D., he worked on the theory and implementation of Inductive Logic Programming (ILP) systems. ILP is a first-order logic form of Machine Learning. José is now a post-doctoral fellow at the Microsoft Language Development Center where he is working on improving Bing’s query rewriting mechanisms so that the Bing backend may return more relevant documents. José also holds a Licenciatura in Informatics Engineering (2004 FCT-UNL), an MSc in Artificial Intelligence (2006 FCT-UNL) and an MSc in BioInformatics (2007 Imperial College). After graduating in 2004 José worked one year at Novabase Business Intelligence.