Publication Bibtex

Anotação de Aspectos Textuais em Sumários do Córpus CSTNews (bibtex)
by Rassi, Amanda Pontes; Zacarias, Andressa Caroline Inácio; Maziero, Erick Galani; Souza, Jackson Wilke da Cruz; Dias, Márcio Souza; Jorge, Maria Lucía Del Rosario Castro; Cardoso, Paula Christina Figueira; Balage Filho, Pedro Paulo; Camargo, Renata Tironi; Agostini, Verônica; Felippo, Ariani Di; Seno, Eloize Rossi Marques; Rino, Lucia Helena Machado; Pardo, Thiago Alexandre Salgueiro
Abstract:
Neste relatório técnico discorre-se sobre a anotação de aspectos textuais nos sumários manuais multidocumento do Córpus CSTNews. Esse córpus foi construído principalmente com vistas à Sumarização Automática Multidocumento. Ele é composto por coleções de textos jornalísticos provenientes de agências de notícias on-line conhecidas do Brasil. Especificamente, cada coleção contém em média 3 textos sobre um mesmo assunto, e cada texto advém de uma agência distinta. A partir do CSTNews, vários subcórpus foram construídos. Um deles é composto pelos sumários manuais elaborados para cada uma das coleções, ou seja, existe um sumário manual multidocumento para cada coleção. A anotação manual de aspectos foi feita para esses sumários multidocumento. Os aspectos em foco nessa anotação indicam diferentes tipos de informação que podem ser veiculados por um texto. Podem, por exemplo, referir-se a papéis semânticos como agente (quem), objeto (o que), modo (como), tempo (quando), etc., e, muitas vezes são dependentes do assunto, ou categoria à qual o texto pertence (p.ex.: esporte, mundo, etc.). Essa anotação dos sumários multidocumento do Córpus CSTNews visa trazer mais informatividade às tarefas automáticas, para melhorar sua qualidade. Para a Sumarização Automática Multidocumento, os aspectos podem indicar estruturas padrão (templates) para a modelagem de critérios de seleção e organização do conteúdo nos sumários.

View PDF
Reference:
A. P. Rassi, A. C. I. Zacarias, E. G. Maziero, J. W. d. C. Souza, M. S. Dias, M. L. D. R. C. Jorge, P. C. F. Cardoso, P. P. Balage Filho, R. T. Camargo, V. Agostini, A. D. Felippo, E. R. M. Seno, L. H. M. Rino, T. A. S. Pardo, "Anotação de Aspectos Textuais em Sumários do Córpus CSTNews", Instituto de Ciências Matemáticas e de Computação, Universidade de São Paulo. Série de Relatórios do Núcleo Interinstitucional de Linguística Computacional.: São Carlos-SP, Brazil, 2013.
Bibtex Entry:
@TechReport{Rassi2013AnotacaodeAspectos,
  Title                    = {Anota\c{c}\~{a}o de Aspectos Textuais em Sum\'{a}rios do C\'{o}rpus CSTNews},
  Author                   = {Rassi, Amanda Pontes and Zacarias, Andressa Caroline In\'{a}cio and Maziero, Erick Galani and Souza, Jackson Wilke da Cruz and Dias, M\'{a}rcio Souza and Jorge, Maria Luc\'{\i}a Del Rosario Castro and Cardoso, Paula Christina Figueira and Balage Filho, Pedro Paulo and Camargo, Renata Tironi and Agostini, Ver\^{o}nica and Felippo, Ariani Di and Seno, Eloize Rossi Marques and Rino, Lucia Helena Machado and Pardo, Thiago Alexandre Salgueiro},
  Institution              = {Instituto de Ci\^{e}ncias Matem\'{a}ticas e de Computa\c{c}\~{a}o, Universidade de S\~{a}o Paulo. S\'{e}rie de Relat\'{o}rios do N\'{u}cleo Interinstitucional de Lingu\'{\i}stica Computacional.},
  Year                     = {2013},

  Address                  = {S\~{a}o Carlos-SP, Brazil},

  Abstract                 = {Neste relat\'{o}rio t\'{e}cnico discorre-se sobre a anota\c{c}\~{a}o de aspectos textuais nos sum\'{a}rios manuais multidocumento do C\'{o}rpus CSTNews. Esse c\'{o}rpus foi constru\'{\i}do principalmente com vistas \`{a} Sumariza\c{c}\~{a}o Autom\'{a}tica Multidocumento. Ele \'{e} composto por cole\c{c}\~{o}es de textos jornal\'{\i}sticos provenientes de ag\^{e}ncias de not\'{\i}cias on-line conhecidas do Brasil. Especificamente, cada cole\c{c}\~{a}o cont\'{e}m em m\'{e}dia 3 textos sobre um mesmo assunto, e cada texto adv\'{e}m de uma ag\^{e}ncia distinta. A partir do CSTNews, v\'{a}rios subc\'{o}rpus foram constru\'{\i}dos. Um deles \'{e} composto pelos sum\'{a}rios manuais elaborados para cada uma das cole\c{c}\~{o}es, ou seja, existe um sum\'{a}rio manual multidocumento para cada cole\c{c}\~{a}o. A anota\c{c}\~{a}o manual de aspectos foi feita para esses sum\'{a}rios multidocumento. Os aspectos em foco nessa anota\c{c}\~{a}o indicam diferentes tipos de informa\c{c}\~{a}o que podem ser veiculados por um texto. Podem, por exemplo, referir-se a pap\'{e}is sem\^{a}nticos como agente (quem), objeto (o que), modo (como), tempo (quando), etc., e, muitas vezes s\~{a}o dependentes do assunto, ou categoria \`{a} qual o texto pertence (p.ex.: esporte, mundo, etc.). Essa anota\c{c}\~{a}o dos sum\'{a}rios multidocumento do C\'{o}rpus CSTNews visa trazer mais informatividade \`{a}s tarefas autom\'{a}ticas, para melhorar sua qualidade. Para a Sumariza\c{c}\~{a}o Autom\'{a}tica Multidocumento, os aspectos podem indicar estruturas padr\~{a}o (templates) para a modelagem de crit\'{e}rios de sele\c{c}\~{a}o e organiza\c{c}\~{a}o do conte\'{u}do nos sum\'{a}rios.},
  PDF                      = {http://www.pedrobalage.com/pubs/Rassi2013AnotacaodeAspectos.pdf}
}
Powered by bibtexbrowser