Sự phát triển của bản đồ chi tiết về đa hình đơn nucleotide ở genome người (single nucleotide polymorphisms – SNPs) kết hợp với công nghệ di truyền hiệu suất cao có thể cho phép chúng ta làm sáng tỏ các đặc tính phức tạp của di truyền, như các bệnh đa yếu tố hoặc sự đáp ứng thuốc trong điều trị.

Nguồn ảnh: https://neuroendoimmune
Giới thiệu
Vào năm 1980, đa hình đơn nucleotide (SNPs) được phát hiện do sử dụng enzyme giới hạn để xác định sự có mặt của vị trí cắt và số điểm cắt bằng cách quan sát sự thay đổi độ dài của các đoạn cắt trên ADN. Vào năm 1990, SNPs đã phần lớn thay thế STRs (short tandem repeat) trong việc sử dụng như một dấu chuẩn lựa chọn cho các nghiên cứu liên kết. Nguyên nhân là do STRs tuy lí tưởng với các nghiên cứu liên kết mà quá trình phân tích phả hệ được sử dụng để xác định một gen chịu trách nhiệm cho một rối loạn đơn gen. Tuy nhiên, về sau các nghiên cứu đã có sự chuyển đổi từ các rối loạn đơn gen sang phân tích các bệnh đa yếu tố như loãng xương, tiểu đường, tim mạch, viêm, rối loạn tâm thần và phần lớn ung thư, là các bệnh xảy ra với tần số cao hơn các bệnh đơn gen và sự quan tâm tăng cao đối với ảnh hưởng của di truyền trong đáp ứng thuốc (pharmaco-genetics). Ngược lại với các trường hợp đơn gen, các bệnh đa yếu tố di truyền này bao gồm nhiều biến đổi ở gen mà mỗi biến đổi đóng góp một phần tác động nhỏ. Phương pháp tiếp cận thông thường là phân tích liên kết (linkage analasys) có giới hạn trong việc phát hiện các ảnh hưởng nhỏ này. Các nghiên cứu với kích thước mẫu lớn, nơi các trường hợp bệnh được so sánh với các đối chứng tương ứng từ cùng một quần thể, có khả năng cao hơn trong phát hiện các ảnh hưởng nhỏ. SNPs được lựa chọn như dấu chuẩn do nó phong phú hơn và được cho là ổn định hơn STRs do tỷ lệ đột biến thấp. Nhiều SNPs là các trình tự chức năng nếu chúng xảy ra trong vùng mang trình tự mã hóa hoặc trình tự quy định trong gen, do đó, có thể kiểm tra trực tiếp sự liên kết giữa kiểu hình và sự thay đổi chức năng gen.
Nghiên cứu kết hợp dựa trên cơ sở SNPs
Nghiên cứu kết hợp dựa trên cơ sở SNP có thể thực hiện bằng 2 cách: trực tiếp phân tích một SNP trong một trình tự mang chức năng, kết hợp với một đặc trưng của bệnh hoặc sử dụng một SNPs như một dấu chuẩn cho mất cân bằng liên kết (linkage disequilibrium -LD). Phương pháp tiếp cận hoàn toàn lý thuyết sử dụng máy tính để mô phỏng đã dự đoán rằng LD không có khả năng mở rộng ra hơn 3kb trong quần thể người, tức là chỉ khoảng 500000 SNPs được sử dụng cho một lần phân tích. Tuy nhiêu, các hiểu biết chính xác về mức độ và mô hình biến động của tần số tái tổ hợp của genome cũng sẽ cho phép chúng ta phân loại dấu chuẩn theo một cách thức thông minh cho một lần phân tích genome và rút ngắn hơn thời gian và kích thước mẫu cần thiết. Một hệ quả của việc sử dụng quá nhiều dấu chuẩn đồng thời (nhiều cuộc kiểm tra độc lập) là lượng mẫu yêu cầu để phát hiện các ảnh hưởng di truyền nhỏ có ý nghĩa thống kê là khá lớn. Do đó, một thí nghiệm như vậy sẽ yêu cầu lượng lớn các bệnh nhân và các nhóm đối chứng. Hiện nay, quy mô thí nghiệm lớn như vậy là không khả thi về mặt kinh tế, vì vậy cách tiếp cận phân tích gen ứng cử viên – gen được lựa chọn trên cơ sở chức năng sinh học và nghiên cứu, kết hợp với các kiểu hình của bệnh đang rất thịnh hành. Tuy nhiên phương pháp này không đủ thoả mãn do hiện nay chúng ta biết rất ít về chức năng đầy đủ của tất cả các gen, chỉ hiểu biết về số ít sản phẩm gen và cũng hiểu ít về chi tiết sinh học phân tử của phần lớn các bệnh phức tạp. Vì vậy quá trình chọn lựa các ứng cử viên phù hợp có tính may rủi.
Xác định SNPs
Rõ ràng việc xác định và mô tả lượng lớn SNPs là cần thiết trước khi chúng ta có thể sử dụng chúng rộng rãi như một công cụ di truyền. Khoảng vài trăm ngàn SNPs sẽ được yêu cầu như một nguồn tài nguyên để xây dựng các bộ dấu chuẩn tối ưu cho các nghiên cứu. 4 phương pháp thường được sử dụng cho phát hiện SNPs (hay đột biến) là: (i) phân tích đa hình sợi đơn (identification of single strand conformation polymorphisms- SSCPs), (ii) phân tích dị sợi kép (heteroduplex analysis), (iii) giải trình tự trực tiếp DNA và (iv) các mảng phát hiện biến thể (the developed variant detectorarrays -VDAs). Với SSCP, tỉ lệ thành công biến đổi từ 70-95%, tốn nhiều công sức và có hiệu suất tương đối thấp, mặc dù các phương pháp cho công suất cao hơn cũng đang được phát triển. Phân tích dị sợi kép là phương pháp phổ biến cho phát hiện SNPs do sự đơn giản, giá thành thấp và tỉ lệ phát hiện cao (95-100%). Phương pháp phát hiện SNPs bằng giải trình tự trực tiếp cũng khá được yêu thích. Một khi phản ứng giải trình tự được hoàn thành, một hệ thống mao mạch Applied Biosystems có thể tạo ra trình tự từ >1500 mảnh DNA 500bp trong 48h với sự can thiếp của con người. Dye giải trình tự sẽ phát hiện 95% các dị hợp tử, các dye đắt tiền hơn và cần nhiều công sức hơn có thể phát hiện 100%. Công nghệ VDA cũng có nhiều ưu điểm và tỷ lệ phát hiện cao, cho phép phát hiện các SNPs bằng quá trình lai sản phẩm PCR với mảng array sử dụng đầu dò oligonucleotide trên một chip thuỷ tinh và đo sự khác biệt trong liên kết lai giữa oligonucleotides phù hợp và không phù hợp. Ngoài việc chọn lựaphương pháp cho phát hiện SNPs, quần thể sử dụng để phát hiện SNPs cũng cần được chọn lựa. Tần số allen SNPs khác nhau đáng kể giữa các dân tộc khác nhau và các quần thể khác nhau. Các công ty phân tích SNPs đã lựa chọn sử dụng các nhóm người đa sắc tộc để tối đa hóa cơ hội phát hiện SNPs. Một số nghiên cứu khác lại sử dụng các nhóm người mang bệnh để tìm ra các SNPs, theo logic là các biến thể góp phần vào giai đoạn bệnh sẽ xuất hiện ở tần số cao ở nhóm người này.
Tần số SNPs trong genome người
Bằng nhiều nghiên cứu, gần 300 gen đã được phân tích chi tiết về SNPs, mặc dù phương pháp và nhóm người sử dụng trong mỗi nghiên cứu là khác nhau. Các đột biến trong trình tự không mã hoá và các đột biến đồng nghĩa trong trình tự mã hoá thường phổ biến hơn các đột biến không đồng nghĩa, phản ánh áp lực của chọn lọc tự nhiên. Tuy nhiên, do những nghiên cứu như thế này thường nhắm tới các vùng mã hóa, dữ liệu tạo ra từ chúng không có khả năng phản ánh toàn bộ sự phân bố của SNPs trong genome. Ngược lại, các quy trình của các công ty xác định SNPs được thiết kế để xác định SNPs mà không thiên vị vào vùng mã hóa, và 100000 SNPs đã được bản đồ hóa đã phản ánh sự đa dạng trình tự của NST của người.
Phương pháp định kiểu SNPs
Phương pháp định kiểu SNPs thông dụng nhất hiện nay là “lai, phương pháp cắt và kéo dài mồi”. Lai liên quan đến việc lai một sợi đơn của một sản phẩm PCR có chứa SNPs với oligonucleotide bổ sung và đo mức độ liên kết giữa chúng. Phương pháp kéo dài mồi đo khả năng của DNA polymerase để mở rộng một nucleotide qua vị trí đa hình mà nucleotide này mà sẽ chỉ cho kéo dài qua một trong hai biến thể đã biêt. Công nghệ cắt xác định kiểu SNPs dựa vào khả năng của một enzyme cắt. Trong những năm gần đây, hàng loạt các công ty công nghệ sinh học bắt đầu phát triển các hệ thống hiệu suất cho phát hiện SNPs. Tuy nhiên, sự cân nhắc quan trọng hiện nay không phải là khả năng đạt được số lượng SNPs yêu cầu mà là giá tiền. Một hướng tiềm năng khác giúp giảm các thí nghiệm cần thiết là pooling DNA. Tuy nhiên, DNA pooling không thích hợp cho tất cả mọi nghiên cứu (ví dụ: các nghiên cứu mà yêu cầu xây dựng kiểu hình).
Hiện tại, chúng ta đang ở kỉ nguyên mới phân tích di truyền người. Trình tự genome người cùng với các phương pháp phân tích di truyền hiệu suất cao sẽ giúp chúng ta có khả năng làm sáng tỏ các đặc điểm di truyền phức tạp. Các phương pháp mới sử dụng cho phân tích di truyền sẽ giúp chúng ta giải mã được những câu hỏi hóc búa và sâu sắc về di truyền học từ trước đến nay.
Dịch và tổng hợp từ Human molecular genetics
BioMedia Việt Nam
Sự phát triển của bản đồ chi tiết về đa hình đơn nucleotide ở genome người (single nucleotide polymorphisms – SNPs) kết hợp với công...
Xem bài Điện di (Phần 1) Điện di trên gel polyacrylamide – Natri dodecyl sulfate (SDS-PAGE). Hệ thống điện di trên gel natri dodecyl sulfate (Sodium...
Nếu như bạn cho rằng tất cả các kỹ thuật nhân dòng đều cần phải có các enzyme giới hạn và enzyme nối thì bạn...
Tách chiết bằng phenol là một phương pháp thường được sử dụng để loại bỏ protein ra khỏi một mẫu ADN, ví dụ như mẫu...