Obtaining Linguistic Data: Thu thập Dữ liệu Ngôn ngữ

 


A

Many procedures are available for obtaining data about a language.
Có nhiều thủ tục để có được dữ liệu về một ngôn ngữ.

They range from a carefully planned, intensive field investigation in a foreign country to a casual introspection about one's mother tongue carried out in an armchair at home.
Phạm vi từ một kế hoạch chi tiết, một cuộc điều tra chuyên sâu về một đất nước khác cho tới một sự quan sát tự nhiên về ngôn ngữ mẹ đẻ của một người nói ra trên một chiếc ghế bành ở nhà.

B

In all cases, someone has to act as a source of language data.
Trong tất cả các trường hợp, ai đó phải hoạt động như một nguồn dữ liệu ngôn ngữ - một người cung cấp thông tin.

An informant Informants are (ideally) native speakers of a language, who provide utterances for analysis and other kinds of information about the language (eg translations, comments about correctness, orjudgements on usage).
Người cung cấp thông tin lý tưởng là người bản xứ của một ngôn ngữ, người cung cấp các lời nói để phân tích và các loại thông tin khác về ngôn ngữ (ví dụ như bản dịch, nhận xét về tính đúng đắn, hoặc đánh giá về cách sử dụng).

Often, when studying their mother tongue, linguists act as their own informants, judging the ambiguity, acceptability, or other properties of utterances against their own intuitions.
Thông thường, khi học tiếng mẹ đẻ của họ, nhà ngôn ngữ học đóng vai trò là người cung cấp thông tin, đánh giá sự mơ hồ, khả năng chấp nhận hoặc các thuộc tính khác của lời nói dựa trên trực giác của chính họ.

The convenience of this approach makes it widely used, and it is considered the norm in the generative approach to linguistics.
Sự tiện lợi của cách tiếp cận này làm cho nó được sử dụng rộng rãi, và nó được xem là tiêu chuẩn trong phương pháp tiếp cận ngôn ngữ học.

But a linguist's personal judgements are often uncertain, or disagree with the judgements of other linguists, at which point recourse is needed to more objective methods of enquiry, using non-linguists as informants.
Nhưng đánh giá cá nhân của một nhà ngôn ngữ thường không chắc chắn, hoặc không đồng ý với các phán đoán của các nhà ngôn ngữ học khác, vào thời điểm đó là cần đến các phương pháp điều tra tìm kiếm khách quan hơn, sử dụng những người không phải là nhà ngôn ngữ học làm người cung cấp thông tin.

The latter procedure is unavoidable when working on foreign languages, or child speech.
Thủ tục thứ hai không thể tránh khỏi khi làm việc với ngoại ngữ, hoặc cách nói của trẻ em.

C

Many factors must be considered when selecting informants - whether one is working with single speakers (a common situation when languages have not been described before), two people interacting, small groups or large-scale samples.
Nhiều yếu tố phải xem xét khi lựa chọn người cung cấp thông tin - cho dù người đó đang làm việc với những người nói một mình (một tình huống phổ biến khi ngôn ngữ chưa được mô tả trước đây), hai người tương tác, các nhóm nhỏ hoặc các mẫu quy mô lớn.

Age, sex, social background and other aspects of identity are important, as these factors are known to influence the kind of language used.
Tuổi, giới tính, bối cảnh xã hội và các đặc tính khác là quan trọng, vì những yếu tố này được biết là ảnh hưởng đến loại ngôn ngữ được sử dụng.

The topic of conversation and the characteristics of the social setting (eg the level of formality) are also highly relevant, as are the personal qualities of the informants (eg their fluency and consistency).
Chủ đề đàm thoại và đặc điểm của môi trường xã hội (ví dụ mức độ chính thức) cũng rất có liên quan, cũng như phẩm chất cá nhân của người cung cấp thông tin (ví dụ sự trôi chảy và tính nhất quán của họ).

For larger studies, scrupulous attention has been paid to the sampling theory employed, and in all cases, decisions have to be made about the best investigative techniques to use.
Với những công trình nghiên cứu có quy mô lớn hơn, nhà ngôn ngữ phải chú ý thật kỹ đến lý thuyết lấy mẫu được sử dụng và trong mọi trường hợp, luôn phải đưa ra quyết định về phương pháp điều tra tốt nhất.

D

Today, researchers often tape-record informants.
Ngày nay, các nhà nghiên cứu thường ghi âm người cung cấp thông tin.

This enables the linguist's claims about the language to be checked, and provides a way of making those claims more accurate ('difficult' pieces of speech can be listened to repeatedly).
Điều này cho phép các tuyên bố của các nhà ngôn ngữ học sẽ được kiểm tra và cung cấp cách để làm cho những tuyên bố đó chính xác hơn (những phần khó của bài nói có thể được nghe lại nhiều lần).

But obtaining naturalistic, good-quality data is never easy.
Tuy nhiên, việc có được những tài liệu tốt và tự nhiên không bao giờ là dễ dàng.

People talk abnormally when they know they are being recorded, and sound quality can be poor.
Mọi người sẽ nói chuyện khác thường khi họ biết họ đang được ghi âm, và chất lượng âm thanh có thể sẽ kém .

A variety of tape-recording procedures have thus been devised to minimise the 'observer's paradox' (how to observe the way people behave when they are not being observed).
Do đó, nhiều thủ tục ghi âm đã được lập ra để giảm tới mức thấp nhất 'nghịch lý của người quan sát' (làm cách nào quan sát cách cư xử của mọi người khi họ đang không bị quan sát).

Some recordings are made without the speakers being aware of the fact - a procedure that obtains very natural data, though ethical objections must be anticipated.
Một số bản ghi được thực hiện khi người nói không biết về thực tế (không biết là bị quan sát) - một thủ tục có được dữ liệu rất tự nhiên, mặc dù các phản đối về đạo đức phải được dự đoán.

Alternatively, attempts can be made to make the speaker forget about the recording, such as keeping the tape recorder out of sight,or using radio microphones.
Ngoài ra, sự cố gắng được tạo ra làm cho người nói quên đi việc bị ghi âm, chẳng hạn như giữ máy ghi âm ra khỏi tầm nhìn hoặc sử dụng micrô vô tuyến.

A useful technique G is to introduce a topic that quickly involves the speaker, and stimulates a natural language style (eg asking older informants about how times have changed in their locality).
Một kỹ thuật hữu ích là giới thiệu một chủ đề liên quan đến người nói một cách nhanh chóng và kích thích phong cách nói tự nhiên (ví dụ: hỏi những người cung cấp lớn tuổi về thời gian thay đổi ở địa phương của họ).

E

An audio tape recording does not solve all the linguist's problems, however.
Tuy nhiên, một băng ghi âm không giải quyết được tất cả các vấn đề của nhà ngôn ngữ.

Speech is often unclear and ambiguous.
Bài nói thường không rõ ràng và tối nghĩa.

Where possible, therefore, the recording has to be supplemented by the observer's written comments on the non-verbal behaviour of the participants, and about the context in general, A facial expression, for example, can dramatically alter the meaning of what is said.
Do đó, khi có thể, bản ghi âm phải được bổ sung bởi ý kiến ​​bằng văn bản của người quan sát về hành vi phi ngôn ngữ của người tham gia và về bối cảnh nói chung, ví dụ về biểu hiện khuôn mặt có thể làm thay đổi đáng kể ý nghĩa của những gì được nói.

Video recordings avoid these problems to a large extent, but even they have limitations (the camera cannot be everywhere), and transcriptions always benefit from any additional commentary provided by an observer.
Các bản ghi hình tránh được những vấn đề này ở mức độ lớn, nhưng thậm chí chúng có những hạn chế (máy ảnh không thể ở bất cứ nơi nào), và những bản sao chép luôn có lợi từ bất kỳ bình luận bổ sung nào được cung cấp bởi một người quan sát.

F

Linguists also make great use of structured sessions, in which they systematically ask their informants for utterances that describe certain actions, objects or behaviours.
Các nhà ngôn ngữ học cũng sử dụng rất nhiều các buổi họp có cấu trúc, trong đó họ yêu cầu người cung cấp thông tin một cách có hệ thống những lời phát biểu miêu tả các hành động, đồ vật hoặc hành vi nhất định.

With a bilingual informant, or through use of an interpreter, it is possible to use translation techniques (‘How do you say table in your language?').
Với một người cung cấp thông tin nói hai thứ tiếng, hoặc thông qua việc sử dụng một thông dịch viên, có thể sử dụng các kỹ thuật dịch ('Bạn nói từ “bảng” như thế nào trong ngôn ngữ của bạn?').

A large number of points can be covered in a short time, using interview worksheets and questionnaires.
Một số lượng lớn vấn đề được đề cập trong một thời gian ngắn, sử dụng các bảng câu hỏi phỏng vấn và các bảng câu hỏi.

Often, the researcher wishes to obtain information about just a single variable, in which case a restricted set of questions may be used: a particular feature of pronunciation, for example, can be elicited by asking the informant to say a restricted set of words.
Thông thường, nhà nghiên cứu mong muốn lấy thông tin về một biến duy nhất, trong trường hợp đó, có thể sử dụng một bộ câu hỏi: ví dụ, một tính năng đặc biệt của phát âm có thể được suy ra bằng cách yêu cầu người cung cấp thông tin nói một số từ.

There are also several direct methods of elicitation, such as asking informants to fill in the blanks in a substitution frame (eg I_see a car),or feeding them the wrong stimulus for correction ('Is it possible to say / no can see?').
Ngoài ra còn có một số phương pháp suy luận trực tiếp, chẳng hạn như yêu cầu người cung cấp thông tin điền vào chỗ trống trong khung thay thế (ví dụ: I_see a car), hoặc cung cấp cho họ các thông tin sai để chỉnh sửa ('Có thể nói / không thể nhìn thấy?' ).

G

A representative sample of language, compiled for the purpose of linguistic analysis, is known as a corpus.
Một mẫu đại diện của ngôn ngữ, được biên soạn cho mục đích phân tích ngôn ngữ, được gọi là tạp văn.

A corpus enables the linguist to make unbiased statements about frequency of usage, and it provides accessible data for the use of different researchers.
Một bản tạp văn cho phép nhà ngôn ngữ học đưa ra các tuyên bố khách quan về tần suất sử dụng và cung cấp dữ liệu có thể truy cập cho việc sử dụng các nhà nghiên cứu khác nhau.

Its range and size are variable.
Quy mô, kích thước của khối liệu thường không giống nhau.

Some corpora attempt to cover the language as a whole, taking extracts from many kinds of text; others are extremely selective, providing a collection of material that deals only with a particular linguistic feature.
Một số tạp văn cố gắng chứa đựng toàn bộ ngôn ngữ đó, trích từ nhiều loại văn bản; Những người khác thì cực kỳ chọn lọc, cung cấp một bộ sưu tập các tài liệu chỉ xử lý với một tính năng ngôn ngữ cụ thể.

The size of the corpus depends on practical factors, such as the time available to collect, process and store the data: it can take up to several hours to provide an accurate transcription of a few minutes of speech.
Kích thước của tài liệu tùy thuộc vào các yếu tố thực tiễn, chẳng hạn như thời gian thu thập, xử lý và lưu trữ dữ liệu: có thể mất vài giờ để cung cấp một bản sao chép chính xác của một vài phút nói.

Sometimes a small sample of data will be enough to decide a linguistic hypothesis; by contrast, corpora in major research projects can total millions of words.
Đôi khi một mẫu dữ liệu nhỏ đủ để quyết định một giả thuyết ngôn ngữ; Ngược lại, tạp văn trong các dự án nghiên cứu lớn có thể tổng cộng hàng triệu từ.

An important principle is that all corpora, whatever their size, are inevitably limited in their coverage, and always need to be supplemented by data derived from the intuitions of native speakers of the language, through either introspection or experimentation.
Một nguyên tắc quan trọng là tất cả các bản tạp văn, ở mọi kích cỡ, chắc chắn sẽ bị giới hạn trong phạm vi của chúng, và luôn cần bổ sung bằng các dữ liệu thu được từ trực giác của người bản địa, thông qua việc tự quan sát hoặc thử nghiệm.
 

NGỌC THU

ARTCANDY SHOP NGỌC THU -     Trên   bước   đường   THÀNH   CÔNG , không   có   dấu   chân   của   những   kẻ   LƯỜI   BIẾNG . ...