How Random is a Corpus? The Library Metaphor

Beitrag in einer Fachzeitschrift
(Originalarbeit)


Details zur Publikation

Autorinnen und Autoren: Evert S
Zeitschrift: Zeitschrift für Anglistik und Amerikanistik
Jahr der Veröffentlichung: 2006
Band: 54
Heftnummer: 2
Seitenbereich: 177-190
ISSN: 0044-2305
eISSN: 2196-4726
Sprache: Englisch


Abstract


There is a stark contrast between the random sample model underlying the statistical analysis of corpus frequency data and our intuitive knowledge that sentences are more than random bags of words. The ‘library metaphor’ illustrates how randomness results from the selection of a corpus as the basis for a linguistic study. At the same time it reveals two reasons why corpus data do not fully meet the assumptions of the random sample model. Finally, practicable methods for identifying and quantifying non-randomness are introduced and demonstrated on the example of passive verb forms.



FAU-Autorinnen und Autoren / FAU-Herausgeberinnen und Herausgeber

Evert, Stefan Prof. Dr.
Lehrstuhl für Korpus- und Computerlinguistik


Forschungsbereiche

Methodologie der Korpuslinguistik und Digital Humanities
Lehrstuhl für Korpus- und Computerlinguistik


Zitierweisen

APA:
Evert, S. (2006). How Random is a Corpus? The Library Metaphor. Zeitschrift für Anglistik und Amerikanistik, 54(2), 177-190.

MLA:
Evert, Stefan. "How Random is a Corpus? The Library Metaphor." Zeitschrift für Anglistik und Amerikanistik 54.2 (2006): 177-190.

BibTeX: 

Zuletzt aktualisiert 2018-11-08 um 00:10