Mark Alves
Montgomery College
Nghiên Cứu Ngữ Học Về Các Nguồn Gốc Của
Ngôn Ngữ Việt Nam:
Tổng Quan
Ngô Bắc dịch
Đại Ý:
Trong khi phần lớn các nhà nghiên cứu ngôn ngữ cả trong và ngoài nước Việt Nam coi tiếng Việt là một ngôn ngữ dòng Môn-Khmer, Austroasiatic, một số lập luận đối lập và sự bối rối chung tiếp tục tồn tại trong lĩnh vực công cộng. Bài viết này xem xét bốn giả thuyết liên quan đến nguồn gốc ngôn ngữ của tiếng Việt, các giả thuyết đặt tiếng Việt một cách khác nhau trong ngữ hệ Austroasiatic (Úc-Á đại lục), Austronesian (Úc đa đảo), Chinese (tiếng Hán), hoặc Tai-Kadai (Tày Trung Tâm). Dựa trên phương pháp học ngôn ngữ và các tình huống hợp lý của mối giao tiếp liên dân tộc, quan điểm thường được giữ vững — tiếng Việt thuộc ngữ hệ Austroasiatic — vẫn là giả thuyết dễ biện hộ nhất.
TỪ KHÓA: Tiếng Việt, ngôn ngữ học lịch sử, liên kết ngôn ngữ, tiếng Trung Hoa, Môn-Khmer, Austroasiatic, Austronesian, Tai-Kadai.
Như có thể nhận thấy khi thoáng nhìn qua các bộ bách khoa toàn thư phổ biến, 1 cộng đồng ngôn ngữ học đặt ngôn ngữ Việt Nam vào ngữ chi (sub-branch) tiếng Môn-Khmer của ngữ hệ Austroasiatic (Úc-Á đại lục), theo đó liên kết nguồn gốc của tiếng Việt với hơn 160 ngôn ngữ được nói khắp vùng Đông Nam lục địa Châu Á.2 Tuy nhiên, đã có những người chống đối lập trường này, những người chống đối đã đề xuất các liên kết khác nhau và những kẻ gộp tiếng Việt một cách khác nhau với các nhóm ngôn ngữ Austronesian, Tai-Kadai, 3 hoặc tiếng Trung Hoa 4. Điều đã làm cho mối liên hệ giữa tiếng Việt với ngữ chi Môn-Khmer khó được chứng minh với sự đoan chắc tuyệt đối là kho từ vựng phong phú trong ngữ vựng Việt Nam có nguồn gốc từ tiếng Úc-Á đại lục (Austroasiatic), tiếng Trung Hoa, tiếng Tày Trung tâm (Tai-Kadai), và ở một mức độ thấp hơn, tiếng Úc đa đảo (Austronesian). Hơn nữa, loại hình ngôn ngữ của tiếng Việt, một ngôn ngữ đơn âm (monosyllabic) và có âm điệu (tonal), làm cho nguồn gốc Úc-Á đại lục của nó thậm chí còn ít rõ ràng hơn, vì các ngôn ngữ nhánh Môn-Khmer có xu hướng song âm tiết (bisyllabic) và phi âm điệu (nontonal). Chỉ thông qua sự áp dụng các công cụ tái tạo ngôn ngữ lịch sử, các nguồn gốc Môn-Khmer của tiếng Việt mới có thể được biểu hiện một cách rõ ràng hơn.
Trên thực tế, mặc dù phần lớn các nhà ngôn ngữ học ở Việt Nam có chung quan điểm rằng Tiếng Việt là một ngôn ngữ Austroasiatic, 5 các bản đồ chính thức tại Việt Nam biểu thị sự phân bố địa lý của các nhóm dân tộc 6 và các nhóm ngôn ngữ theo đó tất cả các nhóm đều lệ thuộc, vẫn chưa chắc chắn về vấn đề phân nhóm của tiếng Việt, chỉ cho biết rằng tiếng Việt và tiếng Mường có liên quan nhưng ngụ ý rằng hai ngôn ngữ này có nguồn gốc khác biệt với tất cả các nhóm ngôn ngữ khác ở Việt Nam. Sự bất định kéo dài này thì quan trọng vì tiếng Việt có số lượng người nói lớn nhất (hơn 82 triệu người) so với bất kỳ ngôn ngữ nào ở Đông Nam Á lục địa. Do đó, thật đáng để xem xét lại bằng chứng cung ứng cho các giả thuyết cạnh tranh khác nhau.
Mặc dù hầu hết các ý tưởng được trình bày trong bài viết này có thể được đã được tóm tắt một phần trong các ấn phẩm khác nhau, cho đến nay vẫn chưa có các sự phát biểu tập hợp về các lý do cho việc xác định nguồn gốc Môn-Khmer chứ không phải các giả thuyết cạnh tranh khác. Mục đích của bài viết này là cung cấp một sự trình bày tổng quát, ít tính cách kỹ thuật hơn (với các sự giải thích cho một số thuật ngữ cần thiết) về kết quả của sự nghiên cứu ngôn ngữ lịch sử và sự tranh luận về sự liên kết ngôn ngữ của tiếng Việt (tức là với những ngôn ngữ nào nó có chung nguồn gốc), có tham chiếu đến nhiều giả thuyết khác nhau. Tổng thể, dựa trên ứng dụng thận trọng của phương pháp luận ngôn ngữ lịch sử tiêu chuẩn và các tình huống hợp lý về sự di cư của con người và sự giao tiếp liên chủng tộc, giả thuyết về nguồn gốc Môn-Khmer của tiếng Việt vẫn là khả dĩ nhất; thực sự, bằng chứng minh họa cho loại dữ liệu mà người ta sẽ mong đợi tìm thấy trong việc xác định các nguồn gốc ngôn ngữ thông thường. Hơn nữa, giả thuyết này cung cấp một ví dụ thú vị về sự phát triển của một ngôn ngữ có âm điệu từ một ngôn ngữ phi âm điệu và sự giảm trừ từ một ngôn ngữ đa âm tiết thành ngôn ngữ đơn âm.
Tóm tắt lịch sử nghiên cứu
về các nguồn gốc của tiếng Việt
Bản tóm tắt đầy đủ nhất việc nghiên cứu ban đầu về các nguồn gốc ngôn ngữ học lịch sử của tiếng Việt đến từ một bài báo của William Gage. 7 Câu hỏi về nguồn gốc ngôn ngữ phả hệ của tiếng Việt quay trở lại đầu thế kỷ 19, khi Giám mục Jean-Louis Taberd lần đầu tiên tuyên bố rằng tiếng Việt là một biến loại của tiếng Trung Hoa.8 Sau đó, vào năm 1856, James Logan đề nghị rằng "tiếng An Nam: Annamese" là một phần của ngữ hệ Môn-Khmer, điều ông gọi là “cấu hình (formation) Môn-An Nam”. Lập trường này chắc chắn có tính chất suy đoán khi xét đến số lượng dữ liệu hạn chế cung ứng vào thời điểm đó, 9 và nó đã được bị phản bác vào đầu thế kỷ XX. Năm 1912, nhà sử học và ngôn ngữ học nổi tiếng người Pháp Henri Maspéro đã viết một cuốn sách chuyên khảo trong đó ông cho rằng tiếng Việt thuộc nhóm ngôn ngữ Tày (Tai).10 Mãi cho đến giữa thế kỷ 20, một nhà ngôn ngữ học người Pháp khác, André Haudricourt, đã xuất bản ba bài viết 11 cung cấp nền tảng ngôn ngữ theo đó tiếng Việt có thể được thể hiện một cách thuyết phục có nguồn gốc Úc-Á đại lục (Austroasiatic) theo cả dữ liệu từ vựng (lexical) và ngữ âm (phonological).12 Kể từ đó, nghiên cứu về chủ đề này tập trung phần lớn vào các sự kết nối tiếng Việt-Môn-Khmer đã đề xuất, với Michel Ferlus, 13 Gage, 14 Gérard Diffloth, 15 Nguyễn Văn Lợi, 16 và Nguyễn Tài Cẩn 17 cung cấp một số các ấn phẩm quan trọng nhất về vấn đề này và các công trình của nhiều học giả khác cung cấp hỗ trợ bổ sung. Tuy nhiên, một số yếu tố phức tạp khiến vấn đề vẫn chưa được giải quyết trong con mắt của một số học giả.
Các công cụ lý thuyết trong ngôn ngữ học lịch sử
Như trong khảo cổ học, các khảo hướng trong lĩnh vực ngôn ngữ học lịch sử dựa vào trọng lượng của bằng chứng và các giả thiết hợp lý.18 Cuối cùng, có thể không có sự chắc chắn tuyệt đối trong suy đoán về quá khứ xa xôi, nhưng các giả định hợp lý có thể được thực hiện và các khả năng bị loại trừ dựa trên các dữ liệu ngôn ngữ, văn hóa và lịch sử hiện có. Sử dụng thông tin như vậy, các phát biểu có thể được đưa ra về cấu trúc ngữ học của các ngôn ngữ trong quá khứ (được gọi là "tái cấu trúc: reconstructions"), sự tiếp xúc giữa các ngôn ngữ và các nhóm ngôn ngữ (ví dụ, việc vay mượn các thành tố ngôn ngữ từ vựng và cấu trúc), và mối liên hệ phả hệ ngôn ngữ (tức sự kết nối với một ngữ hệ nhất định). Hai thành phần thiết yếu cho phép các nhà nghiên cứu đặt hai ngôn ngữ vào cùng một họ ngôn ngữ là (1) một bộ từ vựng cơ bản chung và (2) các bộ tương ứng âm thanh lặp lại giữa hai ngôn ngữ (ví dụ: một âm thanh trong một ngôn ngữ giống hoặc tương tự với một âm thanh trong nhiều ngôn ngữ cùng nguồn gốc [tức là các từ có nguồn gốc chung] trong một ngôn ngữ khác, do đó thiết lập một khuôn mẫu của sự tương ứng). Trường độ thời gian kéo dài có thể khiến một số vấn đề bị nghi ngờ vì nhiều thay đổi có thể diễn ra theo thời gian, nhưng ngay cả như thế, các khuôn mẫu của các sự tương ứng âm thanh phải đủ hoàn chỉnh để cho phép các sự tái tạo của một ngôn ngữ nguyên mẫu (protolanguage), nghĩa là, một ngôn ngữ trong quá khứ mà từ đó các ngôn ngữ liên quan phát sinh. Ngoài ra, khi có thể, các chi tiết lịch sử, khảo cổ học và / hoặc nhân chủng học phải cung cấp bằng chứng chứng thực và các tình huống khả dĩ để giải thích cho việc phân tách một ngôn ngữ thành nhiều ngôn ngữ.
Thuật ngữ “từ vựng cơ bản: basic vocabulary” 19 mang tính chủ quan và thậm chí theo trường phái ấn tượng, nhưng đối với các nhóm ngôn ngữ lâu đời — chẳng hạn như tiếng Ấn-Âu (Indo-European), kết nối các ngôn ngữ cách xa nhau về mặt địa lý như tiếng Hindi [một ngôn ngữ tại miền bắc Ấn Độ, phát sinh từ Phạn ngữ :Sanskrit, ND] (Hindi) và tiếng Anh (English), và tiếng Hán-Tạng: Sino-Tibetan, một nhóm với hơn hai trăm ngôn ngữ 20 bao gồm, như tên gợi ý, tiếng Trung Hoa và tiếng Tây Tạng — thuật ngữ này dễ là các ví dụ điển hình. Từ vựng cơ bản bao gồm các loại từ trong một ngôn ngữ ít có khả năng nhất bị mất đi trong khoảng thời gian hàng thế kỷ và hàng thiên niên kỷ và nhiều khả năng sẽ tồn tại cho khoảng thời gian dài hơn các loại từ vựng không cốt lõi (non-core vocabulary) khác. Những từ đó có thể được coi là thực sự cơ bản bao gồm các chữ số đơn giản từ một đến mười, các bộ phận cơ thể, các hiện tượng tự nhiên và động vật phổ biến, cũng như các hành động / hoạt động cơ bản, giữa các lớp ngữ nghĩa phổ quát khác và các khía cạnh của sự tồn tại của con người. Đây chính xác là những từ không chỉ hợp nhất các ngôn ngữ Mon-Khmer thành một họ ngôn ngữ hay ngữ hệ, mà còn kết nối chúng với tiếng Việt. Trong việc xác định sự liên kết ngôn ngữ, các từ có nghĩa chữ tổng quát hơn thì hữu ích hơn 21 so với các từ cụ thể hơn nhưng các từ liên quan là các phân loại thuộc các loại lớn hơn. Ví dụ, từ chim [bird], một từ ngữ Môn-Khmer, đề cập đến toàn bộ một loại ngữ nghĩa, trong khi bồ câu [pigeon], có thể có nguồn gốc tiếng Tày, là một loại chim cụ thể, khiến cho từ ngữ Môn-Khmer hữu dụng hơn. Từ vựng cơ bản có xu hướng chống lại sự tiếp xúc ngôn ngữ ôn hòa (moderate) (tức là liên hệ giữa các chủng tộc dẫn đến sự trao đổi ngôn ngữ), một tình huống xảy ra một số vay mượn từ vựng.22 Điều này làm cho loại từ vựng cơ bản hữu ích hơn cho mục đích xác định các nguồn gốc ngữ học chung của các ngôn ngữ. Cuối cùng, thống kê từ vựng (lexicostatistics), nhằm lượng định tỷ lệ phần trăm từ vựng cơ bản được chia sẻ giữa các ngôn ngữ, là một công cụ bổ sung có thể được sử dụng để xác định các mức độ liên quan giữa các ngôn ngữ và để cung cấp một số thước đo bằng chứng cho sự liên kết ngôn ngữ. Phương pháp thống kê đơn giản này chắc chắn có thể là nền tảng cho việc điều tra thêm nữa, nhưng không nhất thiết dẫn đến sự đoan chắc vì các ngôn ngữ vay mượn các từ ngữ và đôi khi với số lượng lớn các từ ngữ.
Bằng chứng các từ có chung nguồn gốc (cognates) trong hai ngôn ngữ liên quan đến việc xác định các khuôn mẫu âm vị học (phonological) của các âm thanh tương phản song hành. Hơn nữa, càng nhiều các ví dụ về các khuôn mẫu như vậy xuất hiện, lập luận cho trạng thái có cùng nguồn gốc càng có trọng lượng hơn. Chính vì thế, ví dụ, tìm thấy một số trường hợp của các từ hiển thị âm nha (dental sound) / d / trong một ngôn ngữ và âm nha (dental sound) / n / trong một ngôn ngữ một cách khác mang lại sức mạnh cho lập luận rằng những ngôn ngữ này có một số loại kết nối, mặc dù không thể nói một cách chắc chắn là các dựa vào hay sự giao tiếp hay không. Để xác định mối liên hệ phả hệ, các sự tương ứng âm thanh trong số các bộ từ vựng cơ bản trong hai ngôn ngữ phải bao gồm đủ các mục từ vựng để cho phép các sự tái tạo các hệ thống âm thanh hoàn chỉnh và một cách lý tưởng, một số dạng tái thiết văn hóa xã hội (tức một sự tái thiết một hệ thống văn hóa và lối sống hơn là chỉ riêng hệ thống ngôn ngữ) dựa trên các từ vựng cơ bản. Điều này cũng đòi hỏi sự so sánh các giai đoạn thái thiết ban sơ của các nhóm ngôn ngữ và không chỉ hai ngôn ngữ trong các hình thức hiện đại của chúng. Có chung nguồn gốc với các sự tương ứng âm thanh giữa nhiều ngôn ngữ, bao gồm cả những ngôn ngữ cách xa nhau về mặt địa lý (do đó giảm bớt khả tính của các thành tố vay mượn), có thể củng cố các sự xác định về sự liên kết phả hệ. Nếu không có loại bằng chứng này, những sự xác định như vậy sẽ bị suy yếu.
Trong khi việc xác định các từ vựng cơ bản và các sự tương ứng âm thanh thông thường vẫn là cơ sở cho bất kỳ phán đoán nào về sự liên kết ngôn ngữ, trong trường hợp cụ thể của tiếng Việt, cần có các tiêu chí bổ sung để giảm trừ hơn nữa những bất trắc có thể xảy ra. Một trong những mối nguy hiểm nằm ở một Sprachbund, hay khu vực ngôn ngữ, chẳng hạn như Đông Nam Á, là sự kiện rằng các từ trong các ngôn ngữ khác nhau có thể xuất hiện giống nhau về cả âm thanh lẫn ý nghĩa vì những điểm tương đồng về loại hình trong hệ thống âm thanh và ngữ nghĩa, văn phạm [hay ngữ pháp] và các chức năng ngôn ngữ thực dụng nhưng không có liên hệ về từ nguyên học [etymology: sự biến đổi ý nghĩa của từ, ND]. Hiện tượng “có cùng nguồn gốc sai lạc: false cognates" hoặc "trông giống nhau: look-alikes", các trường hợp giống nhau ngẫu nhiên về âm vị học và ngữ nghĩa, là một vấn đề gây rắc rối dễ nhận thấy trong ngôn ngữ học Đông Nam Á bởi vì nhiều ngôn ngữ có một số lượng lớn từ đơn âm, ngoài những điểm tương đồng về loại hình khác. Có một một xu hướng cho các từ hoặc loại từ nhất định trở nên quá phổ biến trong các ngôn ngữ ở một khu vực, chẳng hạn như khu vực ngôn ngữ Đông Nam Á, một nơi với một số lượng lớn lao sự trao đổi liên chủng tộc, đến nỗi chúng thực sự làm giảm khả năng của chúng ta để thiết lập sự liên kết phả hệ. Đây là trường hợp khắp thế giới cho từ "mẹ: mother", rất thường có âm đầu / m /, và cho từ "cha: father", rất thường có âm / b / hoặc âm tương tự. Ở Đông và Đông Nam Á, những từ xuất hiện giống nhau giữa các ngữ hệ khác nhau bao gồm những từ chỉ "mắt: eye" và những từ dùng để chỉ định "cái này / cái kia: this/that," và vẫn chưa có thể nói, dựa trên dữ liệu và phương pháp luận hiện có, là liệu những từ này và những trường hợp tương tự khác có phải là kết quả của những mối quan hệ thậm chí còn cổ xưa hơn giữa các ngữ hệ hoặc đơn giản là sự tiếp xúc ngôn ngữ.
Tốt nhất nên loại trừ các từ có nhiều hơn một nguồn gốc ngôn ngữ khả dĩ hoặc ít nhất được thừa nhận như một sự hỗ trợ yếu hơn cho sự xác định về sự liên kết giữa các ngữ hệ riêng biệt, một lập trương thường không được cứu xét đến trong sự nghiên cứu ngôn ngữ lịch sử Đông Nam Á. Điều này tuyệt đối quan yếu trong một khung cảnh chẳng hạn như miền Bắc Việt Nam để kiểm tra các kết nối từ vựng khả hữu trong tất cả các ngôn ngữ lân cận — không ưu tiên cho một nhóm này hơn nhóm khác — vì khu vực đó là một mắt xích liên kết địa lý giữa Trung Hoa, Đông Nam Á Đại lục và Đông Nam Á hải đảo. Cuối cùng, hiện tượng từ tượng thanh (onomatopoeia) là một vấn đề nữa làm suy yếu các tuyên bố về các từ cùng nguồn gốc; ví dụ, có từ tiếng Việt cắt [cut] cũng như các hình thức phiên âm (ngữ âm) tương tự.cho cùng từ ấy trong các ngôn ngữ Môn-Khmer (ví dụ: Khmer kat), Tày: Tai (ví dụ: tàt), và tiếng Hoa Nam (ví dụ: chit 3 tiếng Quảng Đông). Một khảo hướng dè dặt hơn sẽ tích lũy các từ có cùng nguồn gốc tiềm năng nhưng sau đó loại trừ hoặc đối xử càng cẩn thận càng tốt theo tiêu chí loại trừ (xem danh sách bên dưới). Các dữ liệu còn lại do đó sẽ có giá trị như bằng chứng của sự liên kết ngôn ngữ. Các tiêu chí để xác định sự liên kết ngôn ngữ di truyền do đó sẽ bao gồm những điều sau:
1. Số lượng từ vựng cơ bản (được bao gồm: inclusive)
2. Các khuôn mẫu tương ứng ngữ âm của từ vựng cơ bản (được bao gồm)
3. Số lượng ngôn ngữ trong một ngữ hệ có chung các từ cùng nguồn gốc (được bao gồm)
4. Nhiều xác suất giữa các ngữ hệ khác nhau (bị loại trừ: exclusive)
5. Từ tượng thanh: onomatopoeic (bị loại trừ)
Ngoài phương pháp luận tổng quát được nêu ở trên, các tình huống lịch sử của sự di cư và tiếp xúc của con người cũng phải được xem xét. Nếu bằng chứng ngữ học chỉ ra một nền tảng lịch sử chung cho hai ngôn ngữ, bằng chứng như vậy cho thấy mối quan hệ liên chủng tộc thuộc loại nào? Những giả thuyết có thể đứng vững ra sao khi đối mặt với dữ liệu lịch sử cung ứng và những gì hay biết được về các tình huống ngôn ngữ, xã hội và địa lý? Tuy nhiên sự nghiên cứu như vậy chắc chắn có tính chất suy đoán, khả năng tồn tại của mỗi trong các giả thuyết về di truyền ngữ học ảnh hưởng đến con người liên can phải được xem xét phần nào.
Tiếng Trung Hoa
Sự tiếp xúc văn hóa của người Việt với người Trung Hoa đã có hơn hai nghìn năm — một nghìn năm đô hộ của Trung Hoa sau đó là một ngàn năm nữa của tư thế quốc gia triều cống và tiếp tục sự tiếp xúc văn hóa với các nước láng giềng hùng mạnh ở phía bắc. Giả định về sự liên kết phả hệ của tiếng Việt với tiếng Trung Hoa, như đã nói ở trên, trở lùi lại thời thực dân và dường như vẫn tồn tại trong các giả định phổ biến. Một cái nhìn như vậy phần lớn dựa trên số lượng từ vựng tiếng Trung Hoa khổng lồ có thể nhận thấy được trong Tiếng Việt, những điểm tương đồng loại hình ngữ học đáng kể giữa hai ngôn ngữ và, ít nhất là cho đến đầu thế kỷ 20, sự sử dụng bằng chữ Hán của người Việt (cùng với chữ Nôm của văn tự Việt Nam dựa trên chữ viết của Trung Hoa).
Tuy nhiên, những khía cạnh này đều có vấn đề. Từ có thể được vay mượn, và nó là loại từ được chia sẻ, không chỉ số lượng, hỗ trợ cho sự tuyên bố về nguồn gốc chung. Tiếp theo, trong khi cả tiếng Trung Hoa và tiếng Việt đều thực sự có âm điệu, tiếng Tày Trung tâm (Tai-Kadai) và tiếng Miêu Dao (Hmong-Mien) láng giềng cũng có âm điệu. Cuối cùng, một văn tự viết tay (là một tạo phẩm của con người có thể chuyển nhượng được và không phải là tặng phẩm di truyền) chung cho hai ngôn ngữ chắc chắn không phải là một chỉ dấu về sự liên kết ngữ học di truyền; chỉ có ngôn ngữ nói mà văn bản đại diện mới có thể sử dụng được cho mục đích này. Điều cũng quan trọng để ghi nhớ rằng sự tương đồng giữa tiếng Việt và tiếng Trung Hoa không nhất thiết là kết quả của ảnh hưởng của Trung Hoa Một số tương đồng có thể là kết quả của các xu hướng chung trong khu vực địa lý bất kể ngữ hệ, hoặc những điểm tương đồng này cũng có thể là kết quả của những thay đổi tự nhiên, nội tại của ngôn ngữ. Ít nhất, nói rằng tình trạng ngữ học hiện nay của tiếng Việt chỉ được xác định một cách đơn độc bởi sự tiếp xúc với tiếng Trung Hoa đơn giản hóa quá mức tình huống.23
Trong khi xem xét những điểm tương đồng đáng chú ý giữa tiếng Việt và Tiếng Trung Hoa thì quan trọng và thú vị, điều quan trọng không kém phải cứu xét những gì không giống hoặc những gì trong tiếng Việt không bắt nguồn từ tiếng Trung Hoa. Chúng ta phải đặc biệt nhận ra những thành phần cần thiết để thiết lập sự liên kết ngữ học giữa tiếng Việt và tiếng Trung Hoa. Ngoại trừ một số tác phẩm văn học và các trường hợp chuyên biệt, không có đại danh từ (pronouns) hoặc chữ số (numerals) trong tiếng Việt có xuất xứ trong tiếng Trung Hoa. Những từ tiếng Việt thực sự cơ bản, các hiện tượng tự nhiên là cũng không phải là tiếng Trung Hoa, chẳng hạn như chó [dog], chim [bird], củi [firewood], nước [water], lá [leaf], rễ [root], và những từ khác, trên thực tế có nguồn gốc từ tiếng Môn-Khmer.24 Nói chung, các loại từ vựng cơ bản gắn kết nhiều loại tiếng Trung Quốc vào một ngữ hệ, phần lớn, không có trong tiếng Việt.25 Về văn phạm (ngữ pháp), thứ tự cụm danh từ trong tiếng Việt với danh từ (noun) đi trước bổ ngữ: modifier (một đặc điểm của cả hai ngôn ngữ Môn-Khmer và tiếng Tày (Tai) trong vùng) thì ngược lại thứ tự trong tiếng Trung Hoa, trong đó bổ ngữ đứng trước danh từ. Thật vậy, loại từ vựng mà tiếng Việt vay mượn từ tiếng Trung Hoa, phần lớn, chính xác là loại từ vựng thường được mượn bởi các ngôn ngữ: từ vựng về các chế tác phẩm cụ thể có tính chất văn hóa và các cấu trúc văn hóa (ví dụ: đồ dùng gia đình và đồ vật hoặc các khía cạnh của y học, quản trị chính quyền và nghệ thuật), và không phải là từ vựng cơ bản, tương đối kháng cự nhiều hơn việc vay mượn.
Thay vì những từ chỉ nguồn gốc chung với tiếng Trung Hoa, có nhiều tầng lớp của các từ vay Trung Hoa. Các nhà nghiên cứu như Wang Li, 26 Haudricourt, 27 Đào Duy Anh, 28 và những người khác sử dụng truyền thống âm vị học lịch sử Trung Hoa đã xác định một lớp từ vựng tiếng Trung Hoa ban đầu, trở lùi lại thời nhà Hán (206 TCN [Trước Công Nguyên] – 220 Sau CN), bằng cách xác định các khuôn mẫu thay đổi giữa các phụ âm đầu và các âm điệu. Những từ chẳng hạn như chỉ “Chủng [loại, kiểu …ND]: Kind / type”, “Chỉ (giấy): paper” và “tỉnh (giếng): well” thể hiện kiểu mẫu phát âm vòm hóa (palatalization) chữ khởi đầu và âm sắc [tiếng Việt trong nguyên bản, ND], 29 như trong Bảng 1. Những từ như vậy thường được người Việt coi là một phần của truyền thống chữ Nôm viết ra, là những ký tự đại diện cho tiếng Việt nói ra, không phải tiếng Trung Hoa. Điều này trái ngược với lớp từ mượn của Trung Hoa từ thời nhà Đường (618–907), những gì có thể gọi là âm Hán Việt tiêu chuẩn, trong đó mỗi chữ là một chữ Hán [Hán tự 漢 字 ] được đọc theo cách phát âm tiếng Việt.
Điều quan trọng cần lưu ý ở đây là truyền thống âm vị học lịch sử Trung Hoa phải được xét đến để thiết lập sự chắc chắn về nguồn gốc của những từ vay ban đầu này.30 Không áp dụng nghiên cứu ngữ học lịch sử về "các từ điển vần" của tiếng Trung Hoa 31 trở lùi lại gần một nghìn năm trăm năm và các nghiên cứu liên quan về các biến loại hiện đại của tiếng Trung Hoa cũng như các cách đọc của Tiếng Nhật và tiếng Hàn các ký tự Trung Hoa, sẽ không có sự tuyên bố hợp pháp cho mối liên hệ ngôn ngữ di truyền với tiếng Trung Hoa có thể được đưa ra. Trong vài trường hợp, thông qua việc vay mượn lẻ tẻ các từ từ một ngôn ngữ khác, các từ cá biệt có thể thay đổi các hình thức ngữ âm của chúng theo những cách bất thường, nhưng một hỗn hợp đáng kể của các khuôn mẫu điển hình, tự nhiên, thường xuyên lặp lại của những sự thay đổi âm thanh phải được xác định để đưa ra một trường hợp khả dĩ.
Hiện tại, với ứng dụng hợp lý của phương pháp luận ngữ học lịch sử, bất kỳ lập luận nào cho rằng tiếng Việt có nguồn gốc từ tiếng Trung Hoa và do đó có các sự kết nối với ngữ hệ Hán-Tạng rộng lớn hơn chỉ đơn giản là không có giá trị.
Tày Trung tâm (Tai-Kadai)
Lời tuyên bố mạnh mẽ nhất về các nguồn gốc Tày của tiếng Việt được đưa ra bởi Maspéro trong một bài viết dài 120 trang trên tờ Bulletin de l’École Française d’Extrême-Orient. 32 Trong tác phẩm đó, Maspéro đã xác định được khoảng một trăm từ mà ông ấy coi là những từ có chung nguồn gốc (cognates) của tiếng Việt và tiếng Tày Trung tâm (Tai-Kadai). Mặc dù ông cũng thừa nhận có các từ ngữ Môn-Khmer cùng nguồn gốc trong tiếng Việt, ông ấy cho rằng, dựa trên số lượng từ nguyên Tày rõ ràng và các đặc điểm ngữ âm học cùng chia sẻ (chẳng hạn như sự hiện diện của các âm điệu và cấu trúc âm tiết chủ yếu là đơn âm), tiếng Việt thuộc ngữ hệ Tày. Tuy nhiên, tác giả Haudricourt 33 chỉ ra rằng một số lượng đáng kể được cho là các dạng tiếng Tày thực sự có nguồn gốc từ tiếng Trung Hoa. Hơn nữa, có thể thấy rằng dữ liệu của Maspéro bộc lộ nhiều trường hợp bằng chứng yếu kém về từ vựng hoặc âm vị học, các trường hợp từ tượng thanh (onomatopoeia (ví dụ: mèo [cat]), hoặc các hình thức được nhận thấy trong các ngôn ngữ khắp Đông Nam Á, như đã lưu ý trong phần về các công cụ lý thuyết trong ngôn ngữ học lịch sử. Một khả tính phức tạp khác là một số các ngôn ngữ Tày trên lãnh thổ Việt Nam vay mượn từ tiếng Việt, một khả tính thường không được các học giả thảo luận trong các tài liệu về ngữ học lịch sử Đông Nam Á. Trong một tình huống như vậy, dữ liệu từ các ngôn ngữ Tày vay mượn từ tiếng Việt có thể tạo ấn tượng sai về các từ vay mượn từ tiếng Tày trong tiếng Việt. Cuối cùng, thiếu vắng một từ vựng cơ bản cùng chia sẻ, chẳng hạn như đại danh từ, từ chỉ con số, bộ phận cơ thể, hoặc các danh từ và động từ cơ bản khác, phản đối gay gắt việc xếp tiếng Việt vào ngữ hệ Tày Trung tâm (Tai-Kadai).
Điều này không có nghĩa là tiếng Việt chưa tiếp xúc với các ngôn ngữ Tày. Một danh sách các từ gần đây hơn được thu thập bởi tác giả Nguyễn Tài Cẩn, 34 người đã gom góp khoảng hai chục từ vay mượn từ tiếng Tày trong tiếng Việt. Một sự so sánh các từ này với các sự tái tạo tiêng Tày nguyên mẫu (proto-Tai) 35 cho thấy rằng thực sự có một số dạng là những ứng viên vay mượn nặng ký. Khảo hướng tốt nhất sẽ là so sánh các hình thức tái tạo của những từ tiếng Việt này với các hình thức tiếng Tày nguyên mẫu được tái tạo. Nếu không, các khuôn mẫu của sự thay đổi âm thanh không thể được ước lượng một cách chính xác và các giả định không xác đáng càng khó loại trừ. Một nỗ lực như vậy đang chờ đợi sự tái tạo hoàn chỉnh của chi tiếng Việt nguyên mẫu (proto-Vietic) (tức là nhóm ngôn ngữ bao gồm tiếng Việt, tiếng Mường, và khoảng hai tá ngôn ngữ Chứt [hay tiếng Rục-Sách, ND]).36 Nhiều từ vay mượn từ tiếng Tài trong tiếng Việt liên quan đến nông nghiệp (ví dụ: đồng ruộng [field] và mương [ditch, canal: mương / kênh]) và chăn nuôi (ví dụ: vịt [duck] và đực [male animal: động vật giống đực]), một tình huống gợi ý mạnh mẽ về một sự giao tiếp ngôn ngữ nhưng không phải là một liên hệ có tác động đáng kể đến ngôn ngữ Việt Nam.
Sự tương đồng về kiểu loại của tiếng Việt và tiếng Tày, đặc biệt là âm điệu, đã được các học giả trong trường phái tư tưởng này coi là dấu hiệu của một số liên kết, hoặc có thể là kết quả của sự tiếp xúc lâu dài đến mức tiếng Việt đã phát triển các đặc điểm của tiếng Tày, nhưng vùng địa lý của âm điệu và các ngôn ngữ đơn âm/biệt lập trên khắp lãnh thổ Trung Hoa và đại lục Đông Nam Á rộng lớn đến mức không có cách nào chỉ sử dụng sự hiện diện của âm điệu (mà không có các yếu tố khác, cụ thể là, các sự tương ứng ngữ âm) như một cách để chứng minh sự liên kết ngôn ngữ. Thật vậy, ngay cả một số ngôn ngữ Môn-Khmer và các ngôn ngữ Chamic Austronesian cũng cho thấy các xu hướng hướng tới tính đơn âm và sự phát triển của các âm điệu.37 Việc sử dụng tính năng phân loại theo khu vực này để hỗ trợ cho các tuyên bố về liên kết ngôn ngữ nhẹ nhất cũng có tính chất nguy hiểm.
Dựa trên sự gần gũi về địa lý của các nhóm người Việt Nam và người Tày và một số bằng chứng từ vựng được đề cập ở trên, điều có thể được nêu ra với sự tương đối chắc chắn rằng tổ tiên của người Việt có tiếp xúc với các dân tộc Tày ở khu vực miền nam Trung Hoa và miền bắc Việt Nam hiện đại từ hai thiên niên kỷ trước. Tác giả Phạm Đức Dương thảo luận về điều có vẻ là một cơ sở ngữ học — bằng chứng từ vựng như đã thảo luận ở trên — để cho thấy sự vay mượn văn hoá của nền nông nghiệp lúa nước giữa người Việt và người Tày.38 Song, tổng quan, dựa vào các dữ liệu và các phương pháp nghiên cứu hiện thời, mối quan hệ Tiếng Việt - Tiếng Tày chỉ có thể được xem nhiều nhất là một sự giao tiếp ngôn ngữ nhẹ nhàng.
Nguồn gốc Thái Bình Dương: Tiếng Úc Đa Đảo và tiếng Nhật
Có một nhóm lý thuyết liên quan, chồng chéo khác, tất cả đều gợi ý về các nguồn gốc Thái Bình Dương của tiếng Việt, bao gồm cả những tuyên bố về nguồn gốc chung với ngữ hệ Úc Đa Đảo (Austronesian) và thậm chí cả với tiếng Nhật. Tác giả Keith Taylor, tại phần mở đầu quyển Birth of Vietnam (Sự ra đời của Việt Nam) của ông, đã viết như sau dựa trên sự phân tích của ông về truyền thống văn hóa và văn hóa dân gian: “Các truyền thống huyền thoại xung quanh Lạc Long Quân và cội nguồn các vua Hùng phát lộ một văn hóa hướng về biển đạt được sự thỏa thuận với môi trường lục địa. Nền văn minh vươn đến với một anh hùng văn hóa từ biển cả, người đã đánh bại một quyền lực lục địa qua việc chiếm đoạt vợ của kẻ thù và biến cô ấy thành mẹ của những người thừa kế của ông ta. . . . Nguồn gốc huyền thoại của các vua Hùng phản ánh một nền văn hóa hàng hải dựa trên các sự bồi đắp chính trị từ các ảnh hưởng của lục địa.” 40
Những người khác đã đưa ra bằng chứng từ vựng để hỗ trợ một quan điểm như vậy. Những tác phẩm chính sơ khởi hỗ trợ sự kết nối tiếng Việt với ngữ hệ Úc Đa Đảo (Austronesian) là những công trình của Nobuhiro Matsumoto, Bình Nguyên Lộc và Nguyễn Ngọc Bích. 41 Matsumoto đã đi xa nhất, đề xuất mối quan hệ giữa tiếng Việt và cả tiếng Nhật lẫn tiếng Mã Lai Đa Đảo (Malayo-Polynesian). Ông ấy đã cung cấp hơn bảy mươi từ có thể có cùng nguồn gốc để liên kết tiếng Việt và tiếng Nhật, nhưng chỉ có chín biểu mẫu đưa ra hỗ trợ sự liên kết Tiếng Việt -Úc Đa Đảo. 42 Bằng chứng bao gồm một số từ vựng có vẻ cơ bản nhưng không phải các dạng cơ bản về mặt ngữ nghĩa, và không có từ chỉ số, các đại [danh] từ, các từ chỉ bộ phận cơ thể hoặc từ vựng thực sự cơ bản khác. Một vấn đề rõ ràng khác đối mặt với danh sách các từ này là vie6c. thiếu các tương ứng ngữ âm, đáng chú ý là đối với các âm điệu, điều mà không có lời giải thích khả dĩ nào được đưa ra.
Xem xét dữ liệu từ vựng trong Bảng 2, lấy từ bài viết của Bình Nguyên Lộc. 43 “Chin: cằm” là một thuật ngữ chỉ bộ phận cơ thể, nhưng không phải là một bộ phận cơ thể cơ bản về mặt ngữ nghĩa, như "face: khuôn mặt" hoặc "arm: cánh tay" và các thuật ngữ chỉ bộ phận cơ thể khác. Tiếng Việt bạn [friend] là một từ vay mượn Hán Việt chuẩn (xem tiếng Quan Thoại [bàn: 伴 companion:bạn đồng hành]). Các hình thức tương tự về mặt ngữ âm cho từ “honey: mật ong” được thấy ở nhiều dạng khác nhau trong các ngôn ngữ của khu vực, bao gồm cả tiếng Môn-Khmer và tiếng Trung Hoa, và không thể được sử dụng để hỗ trợ cho các tuyên bố về nguồn gốc lịch sử được chia sẻ hoặc thậm chí vay mượn. Từ “Island: cù lao” rõ ràng là một khoản vay từ tiếng Chàm vì nó là một trong số ít các từ có hai âm tiết trong tiếng Việt (nghĩa là hai âm tiết không có nghĩa cá thể cũng không phải là từ ghép lại). “Leaf: Lá” rất có thể là tiếng Môn-Khmer; dạng thức tiếng Chàm có tinh chất khiêu khích, nhưng có thể gây hiểu lầm.44 Loại trừ những các ví dụ này làm cho các từ “tree: cây” và “mountain: non” có vẻ như là các sự tương đồng một cách tình cờ.45
Một vấn đề khác là các từ vựng trong tiếng Mã Lai (Malay) và tiếng Chàm không nhất quán, trong khi xem xét sự gần gũi ngữ học tương đối của hai ngôn ngữ (cả hai đều là những phần có liên quan mật thiết với tiếng Mã Lai phụ chi (sub-branch Malayic) của ngữ hệ Úc Đa Đảo (Austronesian), nên cần đưa ra nhiều trường hợp hơn. Tiếp theo, như trường hợp của từ "cây:tree" và "cù lao: island", việc xem xét độ lâu dài về thời gian đáng kể liên quan (hơn hai nghìn năm), các tương ứng âm thanh thực sự ít hiển nhiên hơn, mặc dù các khuôn mẫu có thể giải thích được và có hệ thống về sự thay đổi ngữ âm phải còn nguyên vẹn. Vì vậy, tốt nhất là bằng chứng thì đáng nghi vấn, và những gì chúng ta có được rất có thể là một loại các sự nhân diện cùng nguồn gốc giả mạo. Cuối cùng, gộp chung với nhau, những từ này chắc chắn không tạo thành một tập hợp các từ có hình vị (etyma) tiếng Úc Đa Đảo điển hình, điều sẽ rất thuyết phục nếu không bắt buộc phải đưa ra các tuyên bố về sự liên kết ngôn ngữ.
Theo một khảo hướng khác, tiếng Việt có thể được coi là có liên kết với tiếng Úc Đa Đảo theo quan điểm của giả thuyết về các ngữ hệ Úc (Austric), 46 vốn liên kết các ngữ hệ Úc-Á (Austroasiatic) và ngữ hệ Úc Đa Đảo (Austronesian). Bằng chứng tốt nhất liên kết ngữ hệ Úc Đa Đảo (Austronesian) và ngữ hệ Úc-Á (Austroasiatic) chủ yếu là về hình vị (morphological), 47 và bằng chứng từ vựng thì cực kỳ hiếm có.48 Chỉ một cách gián tiếp tiếng Việt mới thể hiện bất kỳ hình vị và các khuôn mẫu hình thành từ nói chung khả hữu, như đã thấy trong các ngôn ngữ nhỏ, có liên hệ mật thiết của phụ chi tiếng Việt (Vietic), hiển thị tàn tích của tiền tố (prefix: tiếp đầu ngữ) có tính chất nguyên nhân / pa- /, một tiếp đầu ngữ ( hay tiền tố) phổ biến trong nhiều ngôn ngữ Úc Đa Đảo (Austronesian) và Môn-Khmer. Bằng chứng từ vựng cũng khá khan hiếm, với khả năng duy nhất là các từ chỉ “chó: dog”, “mắt: eye”, “cá: fish” và một ít từ khác. Tuy nhiên, ngay cả khi giả thuyết này có thể chống đỡ được, mối quan hệ gần cận nhất vẫn là giữa tiếng Việt Nam và Môn-Khmer, chứ không phải với dòng Úc Đa Đảo (Austronesian).
Xét về vị trí địa lý của tiếng Việt thì quả thực là ở đúng vị trí để có nguồn gốc Úc Đa Đảo (Austronesian). Bờ biển miền bắc Việt Nam có thể tiếp cận đối với những du khách người Austronesian, những người, theo các lý thuyết hiện tại, 49 đi từ miền Nam Trung Hoa đến Đài Loan và sau đó mở rộng về phía nam, đến các vòng cung đảo Philippines và Indonesia. Các dân tộc Chàm thực sự là tổ tiên của làn sóng vĩ đại này đã đến bờ biển phía nam của Việt Nam khoảng hai nghìn năm trước, và người Việt Nam là các người láng giềng ngay sát phía bắc của Đế chế Chàm cho đến khi nó rơi vào tay người Việt Nam trong thế kỷ XV. Có thể đã có sự giao tiếp ngôn ngữ giữa các dân tộc Việt Nam và Chàm, nhưng người Việt thường có mối quan hệ chính trị không thân thiện với các nước láng giềng phía nam của họ. Sự tiếp xúc với họ, theo dữ liệu ngôn ngữ, là tối thiểu; rất một số trường hợp chính thực của các từ vay mượn từ tiếng Chàm hoặc tiếng Úc Đa Đảo (Austronesian) có thể được biểu thị một cách quả quyết.50 Việc thiếu sót một nền tảng vững chắc về từ vựng cơ bản và biểu mẫu của các tương ứng ngữ âm khiến cho sự khẳng định rằng tiếng Việt có nguồn gốc Úc Đa Đảo (Austronesian) cực kỳ yếu ớt.
Úc-Á đại lục (Austroasiatic) và Mon-Khmer
Hơn 150 ngôn ngữ Úc-Á đại lục (Austroasiatic) được phổ biến khắp đại lục Đông Nam Á, từ Việt Nam đến tỉnh Vân Nam, Trung Hoa, xuống các khu vực miền núi của bán đảo Mã Lai (Malaysia), và thậm chí đến phía đông Ấn Độ, vùng kể sau này là địa điểm của phụ-chi Munda của ngữ hệ Úc-Á đại lục (Austroasiatic). Bằng chứng từ vựng và ngữ âm [hay âm vị học, ND] chắc chắn chỉ ra một mối quan hệ giữa tiếng Việt và ngữ hệ Úc-Á đại lục (Austroasiatic). Một số bộ sưu tập chính yếu của khía cạnh này của từ điển tiếng Việt bao gồm những sự thu thập của Maspéro (mặc dù ông này lập luận về nguồn gốc Tiếng Tày của tiếng Việt), Gordon Luce, David Thomas và Robert Headley, và Franklin Huffman.51 Sử dụng phương pháp luận thống kê từ điển, Thomas và Headley đã chỉ ra rằng tỷ lệ phần trăm của từ vựng cơ bản cùng chia sẻ trong tiếng Việt và các ngôn ngữ Môn-Khmer khác là 25 phần trăm, tương tự như phần trăm liên kết các ngữ chi nhánh khác của Môn-Khmer (nói chung từ 25 phần trăm đến 35 phần trăm). Các công trình cung cấp bằng chứng về các tương ứng âm thanh hỗ trợ bao gồm những nghiên cứu của Haudricourt, Ferlus, Gage, Diffloth và Nguyễn Tài Cẩn.52 Ferlus và, trong toàn bộ cuốn sách dành cho chủ đề này, Nguyễn Tài Cẩn chỉ ra con đường phát triển âm vị học, Tiếng Việt đã trải qua hơn hai thiên niên kỷ từ các gốc rễ Môn-Khmer của nó. Từ những nguồn tài liệu khác nhau này, có thể xác định được ba trăm căn tố từ nguyên (etyma) từ ngữ hệ Úc-Á đại lục trong tiếng Việt, lùi xa về tân tiếng Úc-Á đại lục nguyên mẫu (proto-Austroasiatic). Từ vựng có niên đại lùi về các cấp / các phụ chi thấp hơn (ví dụ: Môn-Khmer, Đông Môn-Khmer, v.v.) cũng có thể được xác định, từ đó trình bày một tình huống ngữ học lịch sử đầy đủ hơn về sự di cư dần dần của các dân tộc Môn-Khmer khắp Đông Nam Á.53
Nền tảng từ vựng liên kết tiếng Việt và tiếng Môn-Khmer bao gồm từ vựng cơ bản chung về ngữ nghĩa và, một cách đáng kể, cùng từ vựng liên quan đến các ngôn ngữ khác và các phụ chi (sub-branch) của các ngôn ngữ Môn-Khmer với nhau. Danh sách một trăm từ năm 1977 của Huffman cho thấy hàng chục 54 các từ cùng nguồn gốc tiềm năng của tiếng Việt / Môn-Khmer có nhiều tương ứng âm thanh với hơn một chục ngôn ngữ Môn-Khmer khác. Điều bằng chứng này cho thấy là (1) từ vựng cốt lõi, (2) các tương ứng âm thanh, và (3) sự phổ biến của từ vựng này trong các ngôn ngữ cả bên trong và giữa các phụ chi của Môn-Khmer. Thực tế cuối cùng đó khiến dữ liệu này có ý nghĩa về mặt phương pháp luận. Các ví dụ về những vấn đề này được hiển thị trong Bảng 3 (các ký tự từ các ấn phẩm gốc đã được lưu giữ), trong đó có dữ liệu từ tiếng Rục, một ngôn ngữ thuộc ngữ chi Vietic được nói ở tỉnh Quảng Bình; 55 Pacoh, được nói ở các tỉnh Thừa Thiên và Quảng Trị; 56 Môn, nói ở Thái Lan và Miến Điện; 57 và Riang, cũng được nói ở Miến Điện. 58 Các từ thiếu sót trong các nguồn dữ liệu được biểu thị bằng chữ "x." Điều quan trọng là phải xem xét sự kiện rằng các ngôn ngữ Môn-Khmer khác đến từ bốn phụ chi khác nhau của Môn-Khmer và bao trùm một phạm vi địa lý rộng lớn, nhưng tất cả đều có hầu hết các căn tố từ nguyên Môn-Khmer thường thấy, một sự kiện củng cố việc bao gồm Tiếng Việt vào ngữ hệ Môn-Khmer và giảm bớt khả tính của một tình trạng vay mượn ngữ học mạnh mẽ
Việc điều tra danh sách các từ cùng nguồn gốc này phát lộ các mô hình đại diện của các sự tương ứng ngữ âm giữa tiếng Việt và các ngôn ngữ Môn-Khmer khác. Tác giả Ferlus mô tả bằng chứng cho việc giảm trừ các cụm phụ âm gồm hai hoặc ba âm trong tiếng Môn-Khmer thành âm gập đầu lưỡi ra sau (retroflex) trong Tiếng Việt (ví dụ, trong tiếng Việt “tr,” “s,” và “r”). 59 Một số loại các âm điệu trong tiếng Việt tương ứng với các âm thanh cuối có âm tiết nhất định trong tiếng Môn-Khmer, như tác giả Haudricourt đã lưu ý trong bài báo tinh khôi của ông đưa ra giả thuyết của mình về nguồn gốc của các âm điệu trong tiếng Việt.60 Các ví dụ về những tuyên bố này được hiển thị trong Bảng 4, bao gồm các loại tương ứng minh họa các trường hợp như thế trong Bảng 3.61
BẢNG BA: Bằng chứng đối chiếu trong tiếng Việt và tiếng Môn-Khmer
chú thích:
“x” chỉ các từ bị thiếu sót trong các nguồn dữ liệu
i. Từ ngái được nói trong phương ngữ tiếng Việt tại tỉnh Nghệ An, bắc trung phần Việt Nam.
***
Phẩm chất của vốn từ vựng cơ bản Môn-Khmer trong tiếng Việt cũng cao. Ví dụ, ngược lại với những từ khả dĩ mượn từ Tiếng Tày như gà [chicken] hoặc công [peacock], từ tiếng Môn-Khmer, chúng ta nhận thấy rằng từ ngữ được đánh dấu ít nhất về mặt ngữ nghĩa, phổ quát hơn là chim [bird]. Trong số các từ ngữ Môn-Khmer có cùng nguồn gốc trong tiếng Việt, chúng ta cũng tìm thấy các thuật ngữ động vật thực sự cơ bản như chó [dog], cá [fish] và rắn [snake], trái ngược với các giống cụ thể hơn của những loài động vật này. Về các bộ phận cơ thể, chúng ta tìm thấy chân [leg/foot], tay [arm/hand], tai [ear] và mũi [nose], những từ được kết nối khắp ngữ hệ Môn-Khmer và thậm chí xa đến tận các ngôn ngữ Munda của Đông Ấn Độ. Mặc dù ít ví dụ hơn, nhưng cũng có những các động từ từ tiếng Môn-Khmer, chẳng hạn như ngồi [sit], mắng [to listen], 62 và chết [to die]. Tác giả David Thomas đã chứng minh rằng các chữ số từ một đến mười trong tiếng Việt, tất cả đều thuộc nhóm ngôn ngữ Môn-Khmer hoặc một phụ-chi tiếng Môn-Khmer. 63 Mặc dù hệ thống đại danh từ (pronouns) trong tiếng Việt phần lớn là được thay thế bằng một hệ thống các thuật ngữ theo điều kiện xã hội, chủ yếu bắt nguồn từ các thuật ngữ trong quan hệ gia đình, các thuật ngữ thân mật / thô tục như mày [you] và nó [anh ấy / cô ấy / nó] là thuộc ngữ hệ Úc-Á đại lục (Austroasiatic), 64 chịu đựng được một cách chắc chắn ảnh hưởng của việc tái cấu trúc hoàn toàn của các thuật ngữ xưng hô và tham chiếu trong tiếng Việt.65
Các tương ứng ngữ âm của các từ vựng cơ bản đã thảo luận ở trên rất phong phú. Tác giả Gage đã liệt kê hàng chục trường hợp tương ứng âm thanh cá biệt giữa các từ trong tiếng Việt và các từ trong các ngôn ngữ Môn-Khmer.66 Những trường hợp này được chia thành nhiều loại tổng quát, chính xác là loại hỗ trợ cần thiết cho bằng chứng về các mối quan hệ và không chỉ là những điểm tương đồng ngẫu nhiên. Những tương ứng ngữ âm này không cung cấp chỉ là bằng chứng để liên kết tiếng Việt và tiếng Môn-Khmer mà còn là phương tiện tái tạo lại tiếng Việt đến các giai đoạn cách đây vài thế kỷ và trước đó. 67 Một số tiền tố (hay tiếp đầu ngữ: prefixes) Môn-Khmer ban sơ cũng có thể được phục hồi trong tiếng Việt.68
Dữ liệu ngữ học từ ngôn ngữ họ hàng có liên quan chặt chẽ nhưng cực kỳ thận trọng của tiếng Việt, các ngôn ngữ Chứt vùng cao nguyên 69 (chẳng hạn như ngôn ngữ Rục trong Bảng 3) ở Cao Nguyên Bắc Trung Bộ Việt Nam và các khu vực giáp ranh với Lào, 70 cung cấp bằng chứng làm thay đổi các giả thuyết trước đây về các giai đoạn và thời điểm của những phát triển âm vị học nhất định trong tiếng Việt. Tiếng Việt có các cụm phụ âm thì không gây tranh cãi vì một số phương ngữ đã có chúng vào thế kỷ XX, và chúng được trình bày rõ ràng trong các văn bản ghi chép từ thế kỷ XVII (như trong Từ điển năm 1651 của de Rhodes)71 Khi các tiền âm tiết (presyllables) thôi không còn tồn tại trong tiếng Việt thì khó xác định hơn, mặc dù sự hiện diện của chúng trong các ngôn ngữ Chứt có liên quan chặt chẽ, gợi ý một cách mạnh mẽ rằng điều này đã có từ vài thế kỷ trước hoặc sớm hơn. Các khả năng cấu trúc hai âm tiết (bisyllables) trong tiếng Việt chỉ được gợi ý trong một từ vựng Hán-Việt thời nhà Minh (1368–1644), trong đó có hai ký tự, và do đó, hai âm tiết, được sử dụng để biểu thị một số từ nhất định trong tiếng Việt vào thời điểm đó, và điều này có nhiều khả năng là một cách để biểu thị các cụm phụ âm.72 Khi xem xét các giai đoạn trước đó của âm vị học Việt Nam, rõ ràng Do đó, sự tương đồng hiện đại giữa tiếng Việt và tiếng Tày hoặc tiếng Trung Hoa đã đưa ra một quan điểm mới. Giai đoạn hiện đại của cấu trúc âm vị học tiếng Việt đơn giản là điểm cuối cùng gần đây của một tiến trình kéo dài của diễn trình đơn âm hóa (monosyllabification), nhiều phần có thể là do sự giảm trừ nội bộ theo sau các xu hướng loại hình cũng như sự kết hợp dần dần của hàng trăm của các từ đơn âm của tiếng Trung Hoa trong hơn hai nghìn năm.
Trong loại hạng (kiểu chữ) này có hai mẩu thông tin bổ sung làm nổi bật các nguồn gốc Môn-Khmer của tiếng Việt. Thứ nhất, tiếng Việt có bằng chứng của cả cụm đầu từ và các tiền tố (prefixes) hoặc trung tố (infixes), một số trong số đó tương ứng với với các dạng thức Môn-Khmer.73 Bằng chứng như thế hầu hết đã bị mất thông qua quá trình đơn âm hóa. Thứ nhì, các mô hình lập lại xen kẽ (tiếng Việt gọi là láy), trong đó một âm tiết được sao chép một phần nhưng thường với phần làm thay đổi âm thanh, là một khía cạnh gợi ý đến sự tương đồng về kiểu chữ với các ngôn ngữ Môn-Khmer. Phải thừa nhận rằng đây là trường hợp các ngôn ngữ Môn-Khmer được nói trong và gần lãnh thổ Việt Nam hơn so với những nơi xa hơn về mặt địa lý, khiến liên tưởng đến một loại ảnh hưởng khu vực và không nhất thiết phải có sự liên kết ngôn ngữ di truyền.74 Điều có lẽ có sức thuyết phục hơn là hiện tượng lập lại [láy, ND] nhiều từ vựng có thể phân tách được về mặt âm vị học, một đặc điểm được nhận thấy trong tiếng Việt và tiếng Pacoh của ngôn ngữ Môn-Khmer, một đặc điểm ngôn ngữ đặc thù đáng chú ý.75
Tóm tắt và so sánh các giả thuyết
Tại điểm này, chúng ta ở vị trí để so sánh các giả thuyết khác nhau về mặt sức mạnh của các lập luận ngữ học và tính khả dĩ của các tình huống lịch sử-nhân chủng học. Bảng 5 cung cấp sự lượng giá của tác giả này về phẩm chất của bằng chứng ngữ học cho các nhóm ngôn ngữ nguồn gốc khả hữu khác nhau. Chỉ nhóm Môn-Khmer đã biểu thị là có chung một cốt lõi vững chắc của từ vựng cơ bản với tiếng Việt, với một lượng lớn các tương ứng ngữ âm thông thường, trong khi điều đó không phải là trường hợp cho bất kỳ nhóm ngôn ngữ nào khác. Việc bác bỏ từ vựng Môn-Khmer cơ bản trong tiếng Việt sẽ đòi hỏi việc loại trừ phương pháp luận so sánh cơ bản, điều tuy còn lâu mới hoàn hảo, song vẫn còn quan trọng cho sự sưu tập có hệ thống bằng chứng hỗ trợ. Về các vấn đề ngữ âm (âm vị học) và loại hình học (kiểu chữ) tổng quát, sự chồng chéo hiện diện giữa tất cả các nhóm và đây có lẽ là nguồn cội lớn nhất của sự nhầm lẫn trong cuộc điều tra này. Có lẽ tốt hơn nên xem những đặc điểm ngữ học này trong khu vực ngôn ngữ Đông Nam Á như là kết quả của sự giao tiếp ngôn ngữ lâu dài chứ không phải là kết quả của các nguồn gốc ngôn ngữ được chia sẻ. chung
Về các tình huống của sự tiếp xúc giữa các chủng tộc, để hai giả thuyết về các nguồn gốc Tày Trung tâm hoặc Úc Đa Đảo thành khả thi, cần phải có một thời kỳ trong đó tổ tiên của những người nói tiếng Việt hiện đại ở vào vị thế rất lệ thuộc về mặt xã hội. Có nghĩa, đó sẽ phải là trường hợp một nhóm người nói tiếng Trung Hoa, Tiếng Tày hoặc tiếng Úc Đa Đảo trở nên bị ảnh hưởng thông qua sự tiếp xúc xã hội với một ngôn ngữ Môn-Khmer hoặc nhóm ngôn ngữ đến nỗi những diễn giả này đã mượn hầu hết từ vựng cơ bản của họ trước đây trở nên bị ảnh hưởng bởi sự tiếp xúc với tiếng Trung Hoa. Tất nhiên, nó không thể bị bác bỏ một cách quả quyết rằng, ba thiên niên kỷ trước, tiếng Việt là một tiếng Tày, tiếng Úc Đa Đảo, hoặc tiếng Trung Hoa sau này phát triển các đặc tính ngôn ngữ Môn-Khmer do sự tiếp xúc ngôn ngữ mạnh mẽ, nhưng đó có thể là trường hợp của bất kỳ ngôn ngữ nào trong khu vực. Nếu không có bất kỳ bằng chứng nào khác, những giả thuyết như vậy mang tính suy đoán cao. Trong khi các giả thuyết khác không bao giờ có thể bị bác bỏ hoàn toàn, bằng chứng tích cực vững mạnh nhất vẫn là tiếng Việt có nguồn gốc Úc-Á đại lục (Austroasiatic). Trên thực tế, nghiên cứu về các dạng đơn nhiễm thể (haplotypes) DNA ở Đông Nam Á đã cho thấy sự tương đồng đáng kể giữa người Việt Nam và Thổ dân Malaysia (Orang Asli), có ngôn ngữ thuộc ngữ hệ Úc-Á đại lục (Austroasiatic) — một sự kiện rất phù hợp với giả thuyết được nêu ra ở đây.76
Thông qua việc xem xét các loại từ vựng và nguồn gốc nhóm ngôn ngữ của chúng, một bức tranh lịch sử đơn giản và rõ ràng xuất hiện. Một nhóm những người nói một loại ngôn ngữ Môn-Khmer, những người có nhiều khả năng thực hành cách du canh (swidden agriculture), như nhiều nhóm Môn-Khmer làm, và những người đang phát triển một nền văn minh tinh vi hơn đã tiếp xúc với những người nói Tiếng Tày trong vùng Bắc Bộ Việt Nam hiện đại. Nhóm phụ chi tiếng Việt (Vietic) đã tiếp thu từ những khái niệm của tiếng Tày và các từ liên quan đến nông nghiệp lúa nước và cách thức chăn nuôi gia súc, các sự thực hành có thể đã cho phép sự phát triển hơn nữa của nền văn minh Việt Nam thuở sơ khai. Tuy nhiên, dường như không có bất kỳ bằng chứng chắc chắn nào cho thấy sự tiếp xúc mạnh mẽ với các ngôn ngữ Tày một cách đặc biệt đã làm thay đổi cấu trúc ngữ học tiếng Việt, đúng hơn là một loại tiến trình tổng quát của sự đồng nhất hóa (homogenization) ngôn ngữ trong đó các ngôn ngữ có nhiều nguồn gốc trong vùng trở nên giống nhau về mặt loại hình (kiểu chữ). Những điểm tương đồng về ngôn ngữ như thế giữa tất cả các ngôn ngữ dường như là kết quả của hàng thiên niên kỷ tiếp xúc giữa các nhóm ngôn ngữ khác nhau. Tiếp theo là sự tiếp xúc giữa Tiếng Việt Nam và tiếng Trung Hoa. Đặc biệt trong vài thế kỷ qua, từ vựng tiếng Việt đã thấm nhuần từ vựng Hán Việt và đã kết thúc với các kiểu mẫu hình thành âm vị và hình thái / từ, gần giống với tiếng Trung Hoa hiện đại.76 Về bản thể, tiếng Việt là một thứ Tiếng Môn-Khmer với một sự hiểu biết sơ đẳng về các từ vay mượn của tiếng Tày và một tầng lớp nặng nề của từ vựng tiếng Trung Hoa và một số ảnh hưởng về cấu trúc — một sự phát biểu đơn giản nhưng hợp lý dựa trên dữ liệu và các công cụ phân tích hiện có. /-
—--
CHÚ THÍCH
1. Một số ví dụ bao gồm Encyclopedia Britannica, MSN Encarta, và bách khoa toàn thư trực tuyến được tìm thấy tại www.Wikipedia.org.
2. Để biết thêm về số lượng các ngôn ngữ dòng Môn-Khmer, số lượng người nói những ngôn ngữ đó và các vị trí địa lý của chúng, hãy xem trang web của Summer Institute of Linguistics’ “Ethnologue” database (www.ethnologue.com), một bộ sưu tập khổng lồ cho dù vẫn chưa hoàn thiện về các ngôn ngữ của thế giới. Để biết thêm về nghiên cứu ngữ học của ngữ hệ Môn-Khmer và các phụ chi (sub-branches), hãy truy cập trang web của Paul Sidwell (Đại học Quốc gia Úc),
http://www.anu.edu.au/%7Eu9907217/languages/languages.html
(đã truy cập ngày 24 tháng 5 năm 2006).
3. Thuật ngữ “Tai-Kadai: Tày Trung tâm” dùng để chỉ ba ngữ chi (nhánh) của một ngữ hệ hoàn chỉnh, bao gồm Kam-Tai, Kadai và Hlai. Trong bài viết này, thuật ngữ thường được sử dụng “Tai: Tày, chỉ một nhóm con trong phân nhóm Kam-Tai, là thuật ngữ được ưu tiên. Không nên nhầm lẫn “Tai: Tày” với “Thai” (với chữ “h”), từ sau ám chỉ ngôn ngữ quốc gia của Thái Lan và chỉ là một trong năm mươi ngôn ngữ Tày.
4. Thuật ngữ “tiếng Trung Hoa” trong bài viết này đề cập đến một nhóm các ngôn ngữ có liên quan— một số nhóm chính (ví dụ: Mandarin: Quan Thoại, Yue: Việt, Min: Mân, v.v.), mỗi nhóm có hàng chục các phương ngữ / các tiếng vùng, miền khác nhau — chứ không phải là một loại tiếng Trung Hoa duy nhất.
5. Đây là một tuyên bố được nhìn nhận có tính chất suy đoán, nhưng nó có vẻ là lập trường giữa các nhà ngôn ngữ học của Viện Ngôn Ngữ Học Hà Nội và trong số hầu hết các các nhà nghiên cứu ngôn ngữ học ở các trường đại học khác ở Việt Nam. Để lấy mẫu ý kiến về chủ đề này, xem trên trang web của Viện Ngôn Ngữ Học Hà N4i (www.ngonngu.net), cho thấy sự chấp nhận các nguồn gốc Úc-Á đại lục (Austroasiatic) của Tiếng
6. Đặng Nghiêm Vạn, Chu Thái Sơn, và Lưu Hùng, The Ethnic Minorities in Vietnam (Hà Nội: Foreign Languages Publishing House, 1984).
7. William W. Gage, “Vietnamese in Mon-Khmer Perspective,” Southeast Asian Linguistics Presented to André-G. Haudricourt, đồng biên tập bởi S. Ratankul, D. Thomas, và S. Premisirat (Bangkok: Mahidol University, 1985), 493–524.
8. Cùng nơi dẫn trên.
9. Cùng nơi dẫn trên.
10. Henri Maspéro, “Études sur la Phonétique Historique de la Langue Annamite: Les Initiales [Studies on the Historical Phonology of Annamese: The Initials],” Bulletin de l’École Française d’Extrême-Orient 12 (1912): 1–127.
11. André G. Haudricourt, “La Place du Vietnamien dans les Langues Austroasiatiques [The Place of Vietnamese in the Austroasiatic Languages],” Bulletin de la Société de Paris 49, no. 1 (1953): 122–128; André G. Haudricourt, “De l’Origine des Tons en Vietnamien [The Origin of Vietnamese Tones],” Journal Asiatique 242 (1954): 69–82; André G. Haudricourt, “Comment Reconstruire le Chinois Archaïque [A Comment on the Reconstruction of Archaic Chinese],” Word 10, no. 2–3 (1955): 351–364.
12. Trong bài viết năm 1954 của ông với tiêu đề “De l’Origine des Tons en Vietnamien,” Haudricourt cũng đề xuất một giả thuyết về các nguồn gốc của các âm điệu trong Tiếng Việt, một lý thuyết đã có tác động đáng kể trong sự nghiên cứu lịch sử ngữ học trong các ngôn ngữ Đông và Đông Nam Á châu.
13. Michel Ferlus, “Vietnamien et Proto-Viet-Muong [Vietnamese and Proto-Viet-Muong],” Asia Sud Est un Monde Insulindien 6, no. 4 (1975): 21–55; Michel Ferlus, “Sự biến hóa của các âm tắc giữa (obstruentes mediales) trong tiếng Việt [Changes of Medial Obstruents in Vietnamese],” Ngôn Ngữ Học 2 (1981): 1–21.
14. Gage, “Vietnamese in Mon-Khmer Perspective.”
15. Gérard Diffloth, “Proto-Austroasiatic Creaky Voice,” Mon-Khmer Studies 15 (1989): 139–154; Gérard Diffloth, “Vietnamese as a Mon-Khmer Language,” Papers from the First Annual Meeting of the Southeast Asian Linguistics Society, đồng biên tập bởi Martha Ratliff và Eric Schiller (Tempe: Arizona State University, 1990), 125–139.
16. Nguyễn Văn Lợi, Tiếng Rục [The Ruc Language] (Hà Nội: Khoa Học Xã Hội, 1993).
17. Nguyễn Tài Cẩn, Giáo trình lịch sử ngữ âm tiếng Việt [Textbook of Vietnamese Historical Phonology] (Hà Nội: Giáo Dục, 1995).
18. Một sự khác biệt trọng yếu giữa khảo cổ học vật lý và ngôn ngữ học lịch sử là trong khảo cổ học, tuổi của các đối tượng có thể được đánh giá thông qua việc ấn định niên đại của chất carbon. Ngôn ngữ học lịch sử sau hết là một lĩnh vực không có công cụ chẩn đoán như vậy. Các công cụ xác định niên đại khách quan gần nhất là các tài liệu viết ra, nhưng chỉ khi nào niên kỳ của những tài liệu như thế có thể được chứng thực.
19. Xem Hans Heinrich Hock, Principles of Historical Linguistics (New York: Mouton de Gruyter, 1991); Terry Crowley, An Introduction to Historical Linguistics (New York Oxford University Press, 1992), hoặc các sách giáo khoa ngữ học lịch sử khác để có thêm sự thảo luận về từ vựng cơ bản, thống kê từ vựng và các nguyên tắc và các sự thực hành liên quan khác trong phương pháp luận ngôn ngữ học lịch sử.
20. The Sino-Tibetan Etymological Dictionary and Thesaurus, "Introduction,"
(truy cập ngày 24 tháng 5 năm 2006).
21. Cụm từ “hữu ích hơn” ở đây nên được hiểu theo nghĩa tương đối. Bởi vì trọng tâm của vấn đề là trọng lượng của bằng chứng, điều nhất thiết khả hữu là từ vựng phần nào ít tính chất cơ bản hơn có thể là những từ có cùng nguồn gốc. Các lời tuyên bố cực đoan về bất kỳ phía nào của vấn đề thì không hợp lý, nhưng chúng ta có thể hy vọng rằng sự tích lũy các chi tiết đủ để hỗ trợ cho một lập trường.
22. Muốn có thêm sự thảo luận liên quan, xem Sarah Grey Thomason và Terrence Kaufman, Language Contact, Creolization, and Genetic Linguistics (Berkeley and Los Angeles: University of California Press, 1988).
23. Mark J. Alves, “What’s So Chinese about Vietnamese?” Papers from the Ninth Annual Meeting of the Southeast Asian Linguistics Society, biên tập bởi Graham W. Thurgood (Tempe: Arizona State University, 2001), 221–242.
24. Bằng chứng như vậy đến từ việc so sánh với nhiều ngôn ngữ Môn-Khmer. Trong một số trường hợp, những từ chẳng hạn như những từ chỉ “cá: fish” và “lá: leaf” thậm chí có thể có các kết nối rộng rãi hơn với các nhóm ngôn ngữ khác trong khu vực (“cá: fish” trong tiếng Úc Đa Đảo (Austronesian) và "lá: leaf" trong cả tiếng Hán-Tạng và tiếng Úc Đa Đảo (Austronesian), nhưng chỉ với những sự nghiên cứu có hệ thống với sự áp dụng chủ yếu nghiêm ngặt mới có thể xác định điều này một cách xác đáng hơn. Hơn nữa, một số lượng nhỏ các từ có thể cùng nguồn gốc (cognates) không đủ để xác định liệu vấn đề là do sự giao tiếp ngôn ngữ hoặc có các nguồn gốc ngôn ngữ chung. Tác giả Laurent Sagart thậm chí còn đề ra một mối quan hệ cổ xưa giữa tiếng Hán-Tạng, Austronesian, và Tai-Kadai. “The Higher Phylogeny of Austronesian and the Position of Tai-Kadai,” Oceanic Linguistics 43 (2004), số. 2: 411–444.
25. Một danh sách tốt các căn tố từ nguyên (etyma) Hán-Tạng điển hình được cung cấp bởi Jerry Norman; trong số các từ mà ông liệt kê, hầu như không có bất kỳ từ cùng nguồn gốc tương ứng rõ ràng nào trong từ vựng tiếng Việt bản địa. Jerry Norman, Chinese (Cambridge: Cambridge Nhà xuất bản Đại học, 1988), 13.
26.Wang Li, “Hanyueyu yanjiu [Research on Sino-Vietnamese],” Lingnan Xuebao 9, no. 1 (1948): 1–96.
27. Haudricourt, “Comment reconstruire le Chinois Archaïque.”
28.Đào Duy Anh, Chữ Nôm: Nguồn gốc, cấu tạo, diễn biến [Nôm Script: Origins, Formation, and Transformations] (Hà Nội: Khoa Học Xã Hội, 1979).
29. Mei Tsu-Lin, “Tones and Prosody in Middle Chinese and the Origin of the Rising Tone,” Harvard Journal of Asiatic Studies 30 (1970): 86–110, specifically 95–96.
30. Tác phẩm lịch sử ngữ học đầy đủ nhất về tiếng Hán Việt, với sự thảo luận trọn vẹn về truyền thống ngữ âm lịch sử của tiếng Trung Hoa, là tác phẩm của Nguyễn Tài Cẩn, Nguồn gốc và quá trình hình thành cách đọc tiếng Hán Việt [The Origins and Process of Development of Sino-Vietnamese Readings] (Hà Nội: Khoa Học Xã Hội, 1979).
31. Các từ điển học vần (rhyming dictionaries) đã chỉ ra các cách phát âm của chữ Hán thời Đường và thời Tống. Sự sự thực hiện chính xác của các âm thanh đại diện chỉ có thể được suy ra bằng cách so sánh các cách đọc đó với các nhiều biến loại hiện đại của tiếng Trung Hoa, một chủ đề của cuộc điều tra ngôn ngữ lịch sử quay trở lùi đến cuối những năm 1800. Xem S. Robert Ramsey, The Languages of China (Princeton, NJ: Nhà xuất bản Đại học Princeton, 1987), 116–142, ch. 7.
32. Maspéro, “Études sur la Phonétique Historique de la Langue Annamite: Les Initiales. ” Một tác phẩm ít được trích dẫn hơn là của Edouard Jacques Joseph Diguet, Étude de la Langue Thô [Nghiên cứu về ngôn ngữ Thổ] (Paris: Librairie Maritime et Coloniale, 1910), bao gồm những gì tác giả coi là các từ cùng nguồn gốc giữa Tiếng Việt và một số ngôn ngữ Tày.
33. Haudricourt, “De l’Origine des Tons en Vietnamien.”
34. Nguyễn Tài Cẩn, Giáo trình lịch sử ngữ âm tiếng Việt, 322.
35. Các từ vay mượn từ tiếng Tày trong tiếng Việt đưa ra bởi Nguyễn Tài Cẩn được so sánh với “Proto-Tai-O-Matic,” trên mạng, một cơ sở dữ liệu về các từ tiếng Tày Nguyên Mẫu được tái tạo, quản thủ bởi Center for Research in Computational Linguistics Inc., được cung ứng tại:
(truy cập ngày 1 August, 2006)
36. Như được thảo luận bởi Nguyễn Tài Cẩn, Giáo trình lịch sử ngữ âm tiếng Việt.
37. Theraphan L. Thongkum, “An Instrumental Study of Chong Registers,” Austroasiatic Languages: Essays in Honour of H.L. Shorto, biên tập bởi Jeremy H.C.S. Davidson (London: University of London, School of Oriental and African Studies, 1991), 141–160. Muốn có sự thảo luận tương tự, xem Đoàn Văn Phúc, “Đơn tiết hóa và vấn đề ngôn điệu trong các ngôn ngữ Chăm [Monosyllabification and Questions of Tone in the Chamic Languages],” Những vấn đề ngôn ngữ các dân tộc Việt Nam và khu vực Đông Nam Á [Linguistic Inquiries of the Peoples of Vietnam and the Area of Southeast Asia] (Hà Nội: Khoa Học Xã Hội, 1988), 86–108; và Graham Thurgood, “Language Contact and the Directionality of Internal Drift: The Development of Tones and Registers in Chamic,” Language 71, no. 1 (1996): 1–31.
38. Phạm Đức Dương, “Cội Nguồn Mô Hình Văn Hóa - Xã Hội Lúa Nước của người Việt qua cứ liệu ngôn ngữ, [The Formative Cultural Origins: The Wet-Rice Society of the Vietnamese through Linguistic Data],” Nghiên Cứu Lịch Sử 5 (1982): 43–52.
39. Luigi L. Cavalli-Sforza, The History and Geography of Human Genes (Princeton, NJ: Princeton University Press, 1994), 225, 234.
40. Keith W. Taylor, Birth of Vietnam (Berkeley and Los Angeles: University of California Press, 1983), 1.
41. Nobuhiro Matsumoto, Le Japonais et les langues Austroasiatiques: Étude de vocabulaire comparé [Japanese and the Austroasiatic Languages: A Comparative Lexical Study] (Paris: P. Geuthner, 1928); Bình Nguyên Lộc, Nguồn gốc Mã Lai của dân tộc Việt Nam [The Malay Origins of the Vietnamese] (Sài Gòn: Bách Bộc [sic], 1971; sách in lại, Los Alamitos, CA: Xuân Thu, 1987); Nguyễn Ngọc Bích, “Tiếng Việt, Tiếng Nhật, và họ Mã-Lai Đa-Đảo [Vietnamese, Japanese, and Malayo-Polynesian],” Tuyển Tập Ngôn Ngữ và Văn Học Việt Nam 2 (San Jose: Dòng Việt, 1994), 437–480.
42. Một số lượng lớn các từ tiếng Nhật - tiếng Việt cùng nguồn gốc được đề xuất bởi một người nói tiếng Nhật có lẽ là một dấu hiệu cho thấy năng lực sáng tạo của các nhà ngôn ngữ học để xem các khuôn mẫu bằng ngôn ngữ mà họ biết rõ nhất nhiều hơn, thay vì là sự quán triệt có ý nghĩa. Khả năng tìm các từ có âm tương tự chắc chắn được củng cố khi số lượng trong số các âm vị khả hữu ít hơn, như trong trường hợp của tiếng Nhật, chỉ có năm nguyên âm, ngược lại với mười tám nguyên âm của tiếng Việt, tùy thuộc vào sự biến dạng vùng miền..
43. Nguyễn Ngọc Bích, “Tiếng Việt, Tiếng Nhật, và họ Mã-Lai Đa-Đảo,” 477.
44. Theo giả thuyết, từ tiếng Chàm (Chamic) có thể là một từ mượn của Môn-Khmer, bởi các dân tộc Chàm đã tiếp xúc mạnh mẽ với các dân tộc Môn-Khmer tại Miền Trung Việt Nam trong nhiều thế kỷ qua. Xem công trình của Graham Thurgood, “From Ancient Cham to Modern Dialects: Two Thousand Years of Language Contact and Change [Từ tiếng Chăm cổ đến phương ngữ hiện đại: Hai nghìn năm của sự Tiếp xúc và Thay đổi Ngôn ngữ],” Oceanic Linguistics Special Publication No. 28 (Honolulu: University of Hawai‘i Press, 1999).
45. Một khía cạnh khác cần xem xét là âm tiết nào của một từ có hai âm tiết bị mất. Giữa các ngôn ngữ Môn-Khmer và Chamic, ví dụ, các từ hai âm tiết nhận được nhấn trọng âm ở âm tiết thứ nhì, dẫn đến việc mất âm đầu chứ không phải âm tiết cuối. Giả sử rằng tiếng Việt đã tuân theo mô hình loại hình học [kiểu chữ] này, như bằng chứng lịch sử ngữ học gợi ý mạnh mẽ rằng một từ chẳng hạn như cây [tree] hẳn đã không giữ âm tiết đầu tiên.
46.Pater Wilhelm Schmidt, Die Mon-Khmer-Volker (Braunschweig: Druck und Verlag von Friedrich Vieweg und Sohn, 1906).
47. Lawrence A. Reid, “Morphological Evidence for Austric,” Oceanic Linguistics 33, no. 2 (1994): 323–344.
48. Gérard Diffloth, “The Lexical Evidence for Austric, So Far,” Oceanic Linguistics 33, no. 2 (1994): 309–321.
49. Robert Blust, “Beyond the Austronesian Homeland: The Austric Hypothesis and Its Implications for Archaeology,” Prehistoric Settlement of the Pacific, biên tập bởi W. Goodenough (Philadelphia: Transactions of the American Philosophical Society 86, no. 5 (1996): 117–140).
50. Kenneth Gregerson, trong bài viết của ông, “On Austronesian Lexicon in Vietnamese,” đã thảo luận ba chục từ Úc Đa Đảo (Austronesian) trong tiếng Việt, nhưng phần lớn các từ này phải bị loại bỏ vì nhiều từ có thể đến từ hơn một nhóm ngôn ngữ hay vì phần lớn sẽ gặp các vấn đề ngữ âm nếu chúng sẽ được tái tạo. Kenneth Gregerson, “On Austronesian Lexicon in Vietnamese,” Austroasiatic Languages: Essays in Honour of H.L. Shorto, biên tập bởi Jeremy A.C.S. Davidson (London: School of Oriental and African Studies, 1992), 81–94.
51. Maspéro, “Études sur la phonétique historique de la langue Annamite: Les initiales”; Gordon H. Luce, “Danaw, a Dying Austroasiatic Language,” Lingua 14 (1965): 98–129; David D. Thomas và Robert K. Headley, Jr., “More on Mon-Khmer Subgroupings,” Lingua 25 (1970): 398–418; Franklin E. Huffman, “The Relevance of Lexicostatistics to Mon-Khmer Languages,” Lingua 43 (1976): 171–198; Franklin Huffman, “An Examination of Lexical Correspondences between Vietnamese and Some Other Austroasiatic Languages,” Lingua 43 (1977): 171–198.
52. Haudricourt, “De l’Origine des Tons en Vietnamien”; Ferlus, “Sự biến hóa của các âm tắc giữa (obstruentes mediales) trong tiếng Việt”; Gage, “Vietnamese in Mon-Khmer Perspective”; Diffloth, “Vietnamese as a Mon-Khmer Language”; Nguyễn Tài Cẩn, Giáo trình lịch sử ngữ âm tiếng Việt.
53. Mark Alves, “The Vieto-Katuic Hypothesis: Lexical Evidence,” SEALS XV: Papers from the 15th Meeting of the Southeast Asian Linguistics Society, biên tập bởi Paul Sidwell, The Australian National University, Research School of Pacific and Asian Studies (Canberra: Pacific Linguistics Publishers, 2005), 169–176.
54. Khoảng hai chục từ cùng nguồn gốc bị xem là có ít xác suất xảy ra do các biến chứng khác các loại yếu tố loại bỏ được trình bày ở phần Các Công Cụ Lý Thuyết Trong Ngữ Học Lịch Sử “Theoretical Tools in Historical Linguistics” bên trên.
55. Nguyễn Văn Lợi, Tiếng Rục.
56. Nguyễn Văn Lợi, Đoàn Văn Phúc, và Phan Xuân Thành, Sách học tiếng Pakoh-Taôih [Text for Studying Pakoh-Taoih] (Vietnam: Ủy Ban Nhân Dân, Tỉnh Bình Trị Thiên [The People’s Committee, Binh Tri Thien Province], 1984).
57. Luce, “Danaw, a Dying Austroasiatic Language.”
58. Cùng nơi dẫn trên.
59. Ferlus, “Sự biến hóa của các âm tắc giữa (obstruentes mediales) trong tiếng Việt.”
60. Haudricourt, “De l’Origine des Tons en Vietnamien.”
61. Một số câu hỏi liên quan đến dữ liệu vẫn tồn tại. Tại sao có những từ với âm điệu sắc trong tiếng Việt không có phụ âm dừng (stop) ở cuối (chẳng hạn như bốn [four] và lá [leaf]), như được đưa bởi Haudricourt trong bài “De l’origine des tons en Vietnamien”? Tại sao một số âm dừng đầu của từ Môn-Khmer cũng dừng lại trong tiếng Việt, nhưng những âm khác lại là các âm mũi (nasals) (chẳng hạn như nước [water] và nó [it])? Điều gì đã dẫn đến việc cắt giảm các cụm thành các phụ âm gập lưỡi ra đàng sau (retrolex) (tức, âm trong tiếng Việt “r,” “s,” và “tr”), như trái ngược với các khả năng khác, đặc biệt vì âm thanh gập lười ra sau (retroflex) hiếm có trong các ngôn ngữ Mon-Khmer, Tày và Chàm lân cận? Tác giả Diffloth, trong bài viết “Proto-Austroasiatic Creaky Voice”, đã cung cấp dữ liệu có thể hoặc không có thể giải thích cho câu hỏi đầu tiên. Vấn đề thứ hai sẽ cần được nghiên cứu thêm. Thứ ba vấn đề vẫn chưa được giải thích đầy đủ, mặc dù sự vay mượn lớn lao và sự tiếp xúc sau đó với tiếng Trung, đã được tái tạo với các âm gập lưỡi ra sau (retroflex) (chỉ có miền bắc Trung Quốc duy trì những âm gập lưỡi ra sau này), có thể đã là một yếu tố.
62. Đây là một hình thức cổ hơn, hiếm khi được sử dụng hơn so với từ tiêu chuẩn nghe.
63. David Thomas, “South Bahnaric and Other Mon-Khmer Numeral Systems,” Linguistics 174 (1976): 65–80.
64. H.J. Pinnow, “Personal Pronouns in the Austroasiatic Languages: A Historical Study,” Lingua 14 (1965): 3–42.
65. Sự tái cấu trúc này xảy ra phần lớn do sự tiếp xúc với tiếng Trung Hoa, từ đó nhiều từ quen thuộc được vay mượn, mặc dù chúng đã phát triển các chức năng không được nhìn thấy trong tiếng Trung Hoa.
66. Gage, “Vietnamese in Mon-Khmer Perspective.”
67. Muốn có sự thảo luận thêm, xem, Ferlus, “Sự biến hóa của các âm tắc giữa (obstruentes mediales) trong tiếng Việt”; and Nguyễn Tài Cẩn, Giáo trình lịch sử ngữ âm tiếng Việt.
68. Michel Ferlus, “L’infixe instrumental -rn- en Khamou et sa trace en Vietnamien [The Instrumental Infix -rn- in Khmu and Its Trace in Vietnamese],” Cahiers de Linguistique, Asie Orientale 2 (1977): 51–55.
69. Thuật ngữ “Chứt” là tên gọi chủng tộc được sử dụng bởi Nguyễn Tài Cẩn, Giáo trình lịch sử ngữ âm tiếng Việt, và chính vì thế toàn thể nhóm ngôn ngữ chi Vietic bao gồm các phụ chi (sub-branches) ngôn ngữ Việt-Mường và Chứt. Tôi đã dùng từ “minor Vietic: nhánh tiếng Việt thứ yếu (nhỏ hơn)” để chỉ nhóm của các ngôn ngữ đó.. Mark J. Alves, “Ruc and Other Minor Vietic Languages: Linguistic Strands between Vietnamese and the Rest of the Mon-Khmer Language Family,” Papers from the Seventh Annual Meeting of the Southeast Asian Linguistics Society, đồng biên tập bởi Karen L. Adams, Thomas John Hudak, và F.K. Lehman (Tempe: Arizona State University, 2003), 3–30.
70. Xem, ví dụ, các dữ liệu về tiếng Rục, trong bài viết của tác giả Nguyễn Văn Lợi, Tiếng Rục. Cũng xem, để có sự thảo luận về việc các dữ liệu như thế cung cấp sự nối kết như thế nào, xem Alves, “The Vieto-Katuic Hypothesis: Lexical Evidence.”
71. Như được ghi nhận bởi Maspéro, “Études sur la phonétique historique de la langue Annamite: Les initiales,” 3.
72. Jeremy H.C.S. Davidson, “A New Version of the Chinese-Vietnamese Vocabulary of the Ming Dynasty-1,” Bulletin of the School of Oriental and African Studies 38, no. 2 (1975): 296–315 và no. 3 (1975): 586–608.
73. Ferlus, “Sự biến hóa của các âm tắc giữa (obstruentes mediales) trong tiếng Việt.”
74. Xem Laurence E. Thompson, A Vietnamese Reference Grammar (Seattle: University of Washington, 1965) để có sự thảo luận về các khuôn mẫu này.
75. Sonny Vu, “Doing Splits at PF: Compound Separability in Vietnamese,” tham luận trình bày tại Ninth Annual Conference of the Southeast Asian Linguistics Society, University of California at Berkeley, May 21–23, 1999.
76.Theodore G. Schurr và Douglass C. Wallace. “Mitochondrial DNA Diversity in Southeast Asian Populations,” Human Biology 74, no. 3 (June 2002): 431–452.
77.Tuy nhiên, trong bài viết “What’s So Chinese about Vietnamese?” tôi tuyên bố rằng (a)phần lớn cấu trúc ngữ học hiện đại của tiếng Việt có thể quy kết cho các tiến trình ngữ học tự nhiên hơn là sự tiếp xúc với tiếng Trung Hoa, (b) tiếng Trung Hoa đã chỉ đóng một vai trò tương đối yếu ớt trong các khía cạnh phi từ vựng (nonlexical) của tiếng Việt, và (c) nhiều sự thay đổi khiến cho tiếng Việt trông giống như tiếng Trung Hoa về mặt cấu trúc chỉ được thực hiện trong vài thế kỷ qua hơn là trong thời kỳ từ nhà Hán đến nhà Đường
—--
Nguồn: Mark Alves, Linguistic Research on the Origins of the Vietnamese Language: An Overview, Journal of Vietnamese Studies, Vol. 1, Numbers 1-2, các trang 104–130. ISSN 1559-372x, electronic ISSN 1559-3738. © 2006 by the Regents of the University of California.
Ngô Bắc dịch và phụ chú
2022