Publication Bibtex

Anotação de subtópicos do córpus multidocumento CSTNews (bibtex)
by Cardoso, Paula Christina Figueira; Rassi, Amanda Pontes; Maziero, Erick Galani; Nobrega, Fernando Antônio Asevedo; Souza, Jackson Wilke da Cruz; Dias, Márcio Souza; Jorge, Maria Lucía Del Rosario Castro; Balage Filho, Pedro Paulo; Camargo, Renata Tironi; Agostini, Verônica; Felippo, Ariani Di; Rino, Lucia Helena Machado; Pardo, Thiago Alexandre Salgueiro
Abstract:
A segmentação topical visa a dividir um texto em segmentos topicalmente coerentes. Esse procedimento pode ser muito útil para aplicações de Processamento de Linguagem Natural, tais como recuperação de informação, sumarização automática e sistemas de perguntas e respostas. Assume-se que um texto tem um tópico principal, que é o assunto sobre o qual se escreve ou discute, e que esse assunto pode ser descrito em uma sequência de subtópicos. Tais subtópicos podem mudar continuamente, sendo que algumas mudanças são mais sutis do que outras. Visando criar uma segmentação de subtópicos de referência, este relatório descreve o processo de anotação de subtópicos do córpus CSTNews, um córpus multidocumento de notícias jornalísticas em português do Brasil. As diretrizes de anotação e seus resultados são apresentados e discutidos. Esta segmentação foi desenvolvida para fins de investigação na área de Sumarização Automática de textos.

View PDF
Reference:
P. C. F. Cardoso, A. P. Rassi, E. G. Maziero, F. A. A. Nobrega, J. W. d. C. Souza, M. S. Dias, M. L. D. R. C. Jorge, P. P. Balage Filho, R. T. Camargo, V. Agostini, A. D. Felippo, L. H. M. Rino, T. A. S. Pardo, "Anotação de subtópicos do córpus multidocumento CSTNews", Instituto de Ciências Matemáticas e de Computação, Universidade de São Paulo. Série de Relatórios do Núcleo Interinstitucional de Linguística Computacional.: São Carlos-SP, Brazil, 2012.
Bibtex Entry:
@TechReport{Cardoso2012Anotacaodesubtopicos,
  Title                    = {Anota\c{c}\~{a}o de subt\'{o}picos do c\'{o}rpus multidocumento {CSTNews}},
  Author                   = {Cardoso, Paula Christina Figueira and Rassi, Amanda Pontes and Maziero, Erick Galani and Nobrega, Fernando Ant\^{o}nio Asevedo and Souza, Jackson Wilke da Cruz and Dias, M\'{a}rcio Souza and Jorge, Maria Luc\'{\i}a Del Rosario Castro and Balage Filho, Pedro Paulo and Camargo, Renata Tironi and Agostini, Ver\^{o}nica and Felippo, Ariani Di and Rino, Lucia Helena Machado and Pardo, Thiago Alexandre Salgueiro},
  Institution              = {Instituto de Ci\^{e}ncias Matem\'{a}ticas e de Computa\c{c}\~{a}o, Universidade de S\~{a}o Paulo. S\'{e}rie de Relat\'{o}rios do N\'{u}cleo Interinstitucional de Lingu\'{\i}stica Computacional.},
  Year                     = {2012},

  Address                  = {S\~{a}o Carlos-SP, Brazil},

  Abstract                 = {A segmenta\c{c}\~{a}o topical visa a dividir um texto em segmentos topicalmente coerentes. Esse procedimento pode ser muito \'{u}til para aplica\c{c}\~{o}es de Processamento de Linguagem Natural, tais como recupera\c{c}\~{a}o de informa\c{c}\~{a}o, sumariza\c{c}\~{a}o autom\'{a}tica e sistemas de perguntas e respostas. Assume-se que um texto tem um t\'{o}pico principal, que \'{e} o assunto sobre o qual se escreve ou discute, e que esse assunto pode ser descrito em uma sequ\^{e}ncia de subt\'{o}picos. Tais subt\'{o}picos podem mudar continuamente, sendo que algumas mudan\c{c}as s\~{a}o mais sutis do que outras. Visando criar uma segmenta\c{c}\~{a}o de subt\'{o}picos de refer\^{e}ncia, este relat\'{o}rio descreve o processo de anota\c{c}\~{a}o de subt\'{o}picos do c\'{o}rpus CSTNews, um c\'{o}rpus multidocumento de not\'{\i}cias jornal\'{\i}sticas em portugu\^{e}s do Brasil. As diretrizes de anota\c{c}\~{a}o e seus resultados s\~{a}o apresentados e discutidos. Esta segmenta\c{c}\~{a}o foi desenvolvida para fins de investiga\c{c}\~{a}o na \'{a}rea de Sumariza\c{c}\~{a}o Autom\'{a}tica de textos.},
  Pages                    = {17},
  PDF                      = {http://www.pedrobalage.com/pubs/Cardoso2012Anotacaodesubtopicos.pdf}
}
Powered by bibtexbrowser