Ontologia Aprendizagem Layer Cake [Cimiano 2006]



Patterns [Hearst 1992] para a classe A subsunção

  • NP como {NP,} * {ou | e} NP
    • "jogos como beisebol e críquete"
  • NP {, NP} * {,} {e | ou} outro NP
    • "coelhos e outros animais"
    • mas: "coelhos e outros animais de estimação"
  • NP {,} {incluindo NP,} * {ou | e} NP
    • "Frutas, incluindo maçãs e peras"
  • NP {,} {especialmente NP,} * {ou | e} NP
    • "Os europeus, especialmente italianos"
    • mas: "presidentes norte-americanos, especialmente os democratas"


Patterns [Ogata e Collier 2004]

  • NP é um NP
    • "Um canguru é um animal que vive na Austrália."
  • um NP chamado | chamado NP
    • "Os japoneses gostam de jogar um jogo chamado Go".
  • NP, NP
    • "Sencha, o chá mais popular no Japão, ..."
  • NP. O NP
    • "João ama sua Ferrari. O carro ... "
  • Entre NP, NP
    • Entre todos os instrumentos musicais, violinos são ... "
  • NP exceto | diferente de NP
    • Funcionários, exceto para os gestores sofrem ... "


Regra JAPE

  • PORTA = Arquitetura Geral de Engenharia Texto
  • escrito em Java
  • madura, utilizada em todo o mundo
  • JAPE = linguagem para prototipagem rápida e eficiente implementação de métodos de análise rasos
  • pode ser usado, por exemplo ~ padrões específicos de domínio (blogs financeiros etc)


JAPE Regra II

rule: Hearst_1 ( (NounPhrase):superconcept {SpaceToken.kind == space} {Token.string=="such"} {SpaceToken.kind == space} {Token.string=="as"} {SpaceToken.kind == space} (NounPhrase):subconcept ):hearst1

-->

:hearst1.SubclassOfRelation = { rule = "Hearst1" }, :subconcept.Domain = { rule = "Hearst1" }, :superconcept.Range = { rule = "Hearst1" }



Contexto Lexical Similaridade (eg [Cimiano e Völker 2005])

  • "Columbus é a capital do estado de Ohio. Columbus tem uma população de cerca de 700.000 habitantes."
  • Columbus (capital (1), estadual (1), Ohio (1), população (1), habitante (1))
  • City (país (2), estado (1), habitante (2), o prefeito (1), a atração (1))
  • Explorer (navio (1), marinheiro (2), descoberta (1))

"Muito provavelmente": City (Columbus)



    Subcategorização Frames

    • "Tina dirige um Ford."
      • Pessoa (Tina). Veículo (Ford).
    • "Seu pai dirige um ônibus."
      • Pai-subclasse de Pessoa
      • Bus subclasse de Vehicle
    • subcat: unidade (subj: pessoa, obj: veículo)
      • \[Person \sqsubseteq \forall drive.Vehicle \]


    Text2Onto



    Suchanek et al. 2009

    Aprender a partir do conhecimento do texto e do fundo via raciocínio:

    "Washington é a capital de os EUA. (...) Nova York é a capital dos Estados Unidos da moda."

    • extraídos: hasCapital (EUA, New York); hasCapital (Estados Unidos, Washington)
    • conhecimento de fundo: hasCapital é uma propriedade funcional
    • possíveis inferências:
      • Nova Iorque = Washington
      • inconsistência (nomes originais suposição)
    • contradições lógicas pode ajudar a detectar erros nas informações extraídas automaticamente


    Leda



    Outras abordagens

    • Regras de associação e estatísticas de co-ocorrência
    • WordNet: \[hyponymy \approx subsumption \]
      • hyponym (banco \ (\ afiada \) 1, instituição \ (\ afiada \) 1)
      • Banco subclasse-de Instituição
    • Substantivo heurísticas frase
      • "O software de processamento de imagem"
    • Agrupamento Instância (por exemplo, Columbus e Washington)
      • Agrupamento hierárquico de vetores de contexto
    • Conhecimento Conclusão Base / Formal Concept Analysis (FCA)
      • faz perguntas engenheiro de conhecimento para completar uma base de conhecimento
      • ferramenta: OntoComp [Sertkaya et al.]


    Ferramentas e frameworks

    Tabela: Lexical aprendizagem ontologia: dados informais ou semi-formais (por exemplo, textos)


    Ferramentas e frameworks II



    Problemas e Desafios

    • Homonímia e polissemia, por exemplo [Ovchinnikova et al. 2006]
      • "Pedro está sentado no banco em frente ao banco."
      • "Um livro interessante está deitado sobre a mesa."
    • Semântica de adjetivos
      • "Flor vermelha", "falso amigo"
    • Cabeças vazias, por exemplo, [Völker et al. 2005], [Cimiano e Wenderoth 2005]
      • "O atum é uma espécie de peixe. The Southern Bluefin é um dos tipos mais ameaçadas de atum."
    • Reticências e underspecification
      • "Mary comecei o livro."
    • Anaphora (por exemplo, pronomes), por exemplo [Cimiano e Völker 2005]
      • "Há uma maçã na mesa. Ele é vermelho."


    Problemas e Desafios (DTC).

    • Metáforas e analogias, por exemplo, [Gust et al. 2007]
      • "Viver é uma viagem."
    • Opiniões, cotações e discurso relatado
      • "Tom acha que os golfinhos são mamíferos."
    • O que deve ser representado como um indivíduo? eg [Zirn et al. 2008]
      • "O canguru é um animal que vive na Austrália."
    • Classe, relação (propriedade do objeto) ou atributo (propriedade datatype)?
      • "Todos os elefantes são cinza."
      • "Feira de Páscoa é um feriado nacional."
    • Conhecimento está mudando por exemplo [Stojanovic 2004], [Zablith et al. 2009]
      • "Plutão é um planeta."




    Creator: darya (VUA)

    Contributors:
    -


    Licensed under the Creative Commons
    Attribution ShareAlike CC-BY-SA license


    This deck was created using SlideWiki.