Hệ gen tham chiếu của người Việt (VGR)
VGR
Hệ gen tham chiếu trên thế giới được xây dựng gần đây nhất (hg37/38) dựa trên quần thể người Mỹ và Châu Âu. Hiện tại, phân tích gọi biến thể nhằm xác định các biến thể chủ yếu dựa trên độ lệch của hệ gen cá nhân so với hệ gen tham chiếu hg38. Tuy nhiên, nhiều biến thể được hiển thị trong hệ gen tham chiếu dưới dạng alen tham chiếu (còn được gọi là alen thường thấy hoặc alen chính) được quyết định dựa trên các quần thể người châu Âu. Các alen phổ biến này có thể là alen hiếm trong các quần thể khác, dẫn đến các biến thể dương tính giả hoặc gọi thiếu biến thể. Phân tích biến thể của hệ gen châu Á có nguồn gốc di truyền ít liên quan đến hg38 sẽ kém chính xác. Vì vậy, đây là bước quan trọng đầu tiên để thiết lập hệ gen tham chiếu đặc trưng cho quần thể người Việt Nam.
Các nhà khoa học đã cố gắng xây dựng hệ gen tham chiếu cụ thể cho từng dân tộc như tại Đan Mạch, Nhật Bản, Hàn Quốc và hệ gen tham chiếu cho từng dân tộc có độ nhạy gọi biến thể cao hơn so với sử dụng mô hình tiêu chuẩn GRCh38. Đã có nghiên cứu nhằm xây dựng hệ gen tham chiếu đặc trưng cho quần thể người Việt Nam dựa trên 100 hệ gen người Kinh nhằm cải thiện việc đối chiếu đoạn đọc ngắn và gọi biến thể trong quần thể người Việt, tuy nhiên hệ gen tham chiếu này chỉ sử dụng dữ liệu biến thể đơn điểm không bao gồm những biến thể chèn xóa (indel) và biến thể cấu trúc (SV); hơn nữa cộng đồng không truy cập được thông tin của hệ gen tham chiếu này.
Trong dự án này, chúng tôi sẽ kết hợp dữ liệu có sẵn từ dự án 1000 hệ gen người Việt hiện có với trình tự đoạn đọc dài theo hướng dẫn của tham chiếu hệ gen người hiện hành để xây dựng Tham chiếu hệ gen người Việt gần như hoàn chỉnh đầu tiên (VGR). VGR mới lạ về mặt khoa học ở chỗ nó là một hệ gen tham chiếu dựa trên biểu đồ có chứa các biến thể gen đặc trưng của người Việt Nam. Tham chiếu dựa trên đồ thị là cấu trúc tham chiếu thế hệ mới, trong đó không chỉ một hệ gen tuyến tính đơn lẻ mà cả các biến thể liên quan sẽ được thể hiện. Do vậy, VGR có thể đại diện cho sự đa dạng di truyền trong quần thể người Việt Nam. VGR sẽ đóng vai trò là hệ gen tham chiếu đáng tin cậy hơn so với hg38 cho các nghiên cứu phân tích hệ gen trong quần thể người dân Việt Nam (và các quần thể có quan hệ gần ở châu Á), chẳng hạn như phân tích gọi biến thể hoặc so sánh các chỉ dấu bệnh từ Sanger hoặc giải trình tự vùng mã hóa mục tiêu (targeted exome sequencing).
Chúng tôi kỳ vọng rằng hệ gen tham chiếu VGR sẽ được tất cả các nhà nghiên cứu hệ gen và các dịch vụ chẩn đoán hệ gen Việt sử dụng rộng rãi. Tác động của hệ gen tham chiếu này sẽ kéo dài vượt quá thời gian của dự án và chúng tôi mong đợi việc nâng cấp hệ gen tham chiếu được thực hiện định kỳ 5 năm một lần, tương tự như đối với hệ gen tham chiếu của Trung tâm Thông tin Công nghệ Sinh học Quốc gia (NCBI) và Viện Tin học Sinh học Châu Âu (EBI).
Đối tác chiến lược
-
Đại học Queensland
-
Đại học California San Diego