Fine-mapping và phân tích gen ứng cử viên qFF3.1 điều khiển tính trạng độ cứng trái của giống cà chua hiện đại

 Fine-mapping và phân tích gen ứng cử viên qFF3.1 điều khiển tính trạng độ cứng trái của giống cà chua hiện đại

Nguồn: Yunhao Han, Xin Li, Can Zhu, Yonglian Wang, Junling Hu, Shumin He, Saifeng Guo, Xiaoxiao Lu, Chunyang Pan, Zejun Huang, Yanmei Guo, Xiaoxuan Wang, Yongchen Du, Lin Yang, Junming Li & Lei Liu. 2026. Fine-mapping and candidate gene analysis of qFF3.1 conferring fruit firmness in a modern tomato variety. Theoretical an Applied Genetics; March 27 2026; vol. 139; article 110

Độ cứng của trái cà chua là một định tính quan trọng cho phẩm chất sau thu hoạch, cách lưu trữ, thời hạn sử dụng, và giá trị thị trường. Trong khi nghiên cứu trước đây tập trung vào cà chua hoang dã hoặc cổ truyền, cơ sở di truyền của tính trạng này trong dòng lai ưu việt chưa được biết đầy đủ. Theo kết quả nghiên cứu, kiến trúc di truyền đã được phân tích đối với tính trạng độ cứng trái trong quần thể con lai cận giao tái tổ hợp (RIL) của cặp lai giữa dòng cận giao hiện đại CF-1 với giống truyền thống Moneymaker. Bản đồ QTL cho thấy có 3 loci điều khiển tính trạng này trên nhiễm sắc thể 3, 4, và 5. Ảnh hưởng QTL chính qFF3.1 trên nhiễm sắc thể 3 giải thích dược 11,10% biến thiên kiểu hình và được xác định thông qua phương pháp BSA-seq (bulked segregant analysis). “Fine-mapping” quần thể con lai F2:3 cho thấy qFF3.1 ở quãng có độ lớn phân tử 111 kb bao gồm 26 mô phỏng gen dự đoán. Kết hợp phân tích “functional annotations” (chú thích di truyền chức năng)cơ sở dữ liệu RNA-seq của dòng con lai NILs (near-isogenic lines), ngươi ta ưu tiên hóa 6 gen ứng cử viên điều khiển tính trạng phát triển thành tế bào và phản ứng ethylene, 4 gen biểu hiện khác biệt qua các giai đoạn chín trái cà chua. Như vậy, qFF3.1 là QTL có ảnh hưởng chính đầu tiên đối với tính trạng quả cứng được phân lập trong dòng cà chua chọn tạo theo hướng cao sản. Kết quả là luận cứ khoa học phân tử về sự điều tiết độ cứng trái cà chua, chiến lược cải tiến giống cà chua có tuổi trái dài hơn và cải thiện những tính trạng sau thu hoạch khác.

Xem https://link.springer.com/article/10.1007/s00122-026-05212-x

GHI CHÚ

Đây là một quy trình kinh điển và vô cùng mạnh mẽ trong Di truyền học xuôi (Forward Genetics) nhằm bóc tách một tính trạng phức tạp từ ngoài đồng ruộng vào tận trong phòng thí nghiệm.

Về mặt khoa học, độ cứng của trái cà chua thực chất là một tính trạng định lượng (quantitative trait) được kiểm soát bởi nhiều gen và chịu ảnh hưởng mạnh của môi trường. Chính vì nó là tính trạng định lượng nên chúng ta mới cần đi tìm các QTL (Quantitative Trait Loci) như qFF3.1.

  • Ý nghĩa ký hiệu: Trong di truyền học, q đại diện cho QTL, FF là Fruit Firmness (Độ cứng trái), 3 nghĩa là nằm trên nhiễm sắc thể số 3, và .1 là locus đầu tiên được định vị trên nhiễm sắc thể này.

  • Sức mạnh của một QTL chính (Major QTL): Việc dán nhãn qFF3.1 là một “QTL chính” chứng tỏ locus này giải thích một tỷ lệ biến dị kiểu hình lớn (giá trị trị số R2 thường >10%, thậm chí cao hơn). Đây chính là “mỏ vàng” cho các nhà chọn giống vì nó mang lại hiệu quả cải tiến kiểu hình rõ rệt nhất khi được ứng dụng.

  • Sử dụng quần thể F2:3: Bằng cách lai các dòng có kiểu gen dị hợp tại vùng qFF3.1, các nhà khoa học tạo ra hàng ngàn cá thể F2 để săn tìm các sự kiện tái tổ hợp cực hiếm (rare recombinants) ngay trong vùng QTL.

  • Kết quả: Việc đánh giá kiểu hình trên thế hệ dòng con F3 tương ứng cho phép thu hẹp khoảng cách genomic của qFF3.1 xuống chỉ còn vài chục đến vài trăm kb, giới hạn số lượng gen ứng viên xuống một con số rất nhỏ (thường dưới 10 gen).

  • Cơ sở dữ liệu NCBI (như BLAST, RefSeq, Gene Ontology) sẽ được khai thác để tra cứu “lý lịch sinh học” (functional annotations) của chúng. Đối với tính trạng độ cứng trái cà chua, các gen ứng viên nặng ký thường lộ diện qua các nhóm chức năng sau:

  • Enzyme sửa đổi thành tế bào: Các gen mã hóa cho Polygalacturonase (PG), Pectin Methylesterase (PME), Expansins (EXP), hoặc Xyloglucan Endotransglycosylase/Hydrolase (XTH). Đây là các “kéo sinh học” trực tiếp cắt mạch polymer khiến thành tế bào bị lỏng lẻo và làm mềm trái khi chín.

  • Hormone thực vật: Các gen liên quan đến con đường sinh tổng hợp hoặc truyền tín hiệu Ethylene (hormone thúc đẩy chín) hoặc Auxin/ABA.

  • Yếu tố phiên mã (Transcription Factors): Các họ gen như MADS-box (như gen RIN) hoặc NAC (như gen NOR) điều hòa tổng thể tiến trình chín.

  • Dòng cận chuẩn NILs (Near-Isogenic Lines): Cặp dòng NILs này được tạo ra có nền di truyền giống nhau đến 99%, ngoại trừ đoạn nhiễm sắc thể mang locus qFF3.1 (một dòng mang alen “Trái cứng” và dòng kia mang alen “Trái mềm”). Do đó, mọi sự khác biệt về kiểu hình hay phân tử giữa chúng đều do qFF3.1 quyết định.

  • Dữ liệu RNA-seq (Transcriptome): Bằng cách giải trình tự RNA của cặp NILs tại các giai đoạn phát triển của trái (Xanh già, Chín vàng, Chín đỏ), dữ liệu sẽ cô lập được các Gen biểu hiện khác biệt (DEGs).

TOOLS THỰC HIỆN

    Để thực hiện một nghiên cứu tích hợp từ lập bản đồ QTL cho đến phân tích cơ chế phân tử (RNA-seq) như trên, các nhà khoa học phải sử dụng một bộ công cụ kết hợp giữa phần mềm di truyền học số lượng, hệ thống xử lý tin sinh học (Bioinformatics pipeline) các cơ sở dữ liệu sinh học quốc tế.

 Phân tích Di truyền & Bản đồ QTL (RILs, F2:3, Fine-mapping). Nhóm phần mềm này dùng để xử lý dữ liệu kiểu hình (độ cứng trái) và kiểu gen (các marker) nhằm xác định chính xác vị trí của locus qFF3.1.

  • WinQTLCartographer: Phần mềm kinh điển chạy trên hệ điều hành Windows, chuyên dùng để lập bản đồ QTL bằng các phương pháp như IM (Interval Mapping) và CIM (Composite Interval Mapping).

  • QTL IciMapping: Phần mềm tích hợp rất mạnh mẽ và phổ biến hiện nay, tối ưu cho việc tìm kiếm QTL ở các quần thể tự phối dòng thuần như RILs hoặc quần thể phân ly cận chuẩn.

  • JoinMap: Phần mềm hàng đầu để xây dựng bản đồ liên kết di truyền (Linkage map), tính toán khoảng cách di truyền (đơn vị cM) giữa các chỉ thị phân tử trên nhiễm sắc thể 3.

  • R/qtl: Một gói thư viện (package) mã nguồn mở trong môi trường lập trình R, dành cho các nhà nghiên cứu muốn tùy biến sâu và vẽ biểu đồ giá trị LOD (LOD score) chất lượng cao.

2. Phần mềm Tin sinh học Phân tích RNA-seq (Cặp dòng NILs)

Để tìm ra các gen biểu hiện khác biệt (DEGs) từ dữ liệu giải trình tự transcriptome của cặp dòng NILs, một quy trình (pipeline) chuẩn gồm các phần mềm sau sẽ được vận hành (thường trên hệ điều hành Linux):

  • Kiểm tra chất lượng thô (QC): FastQC (đánh giá chất lượng file chuỗi đọc gốc .fastq) và Trimmomatic hoặc Cutadapt (cắt bỏ các đoạn trình tự kém chất lượng và trình tự adapter).

  • Căn hàng vào bộ gen tham chiếu (Alignment/Mapping): HISAT2 hoặc STAR – các phần mềm chuyên dụng để ánh xạ các đoạn RNA-seq ngắn lên bộ gen tham chiếu của cà chua một cách nhanh chóng và chính xác.

  • Định lượng mức độ biểu hiện (Quantification): StringTie hoặc FeatureCounts (tính toán số lượng chuỗi đọc phân bố vào từng gen cụ thể).

  • Phân tích biểu hiện khác biệt (Differential Expression): DESeq2 hoặc edgeR (các package chạy trong môi trường R) để cô lập những gen tăng hoặc giảm biểu hiện giữa dòng NIL trái cứng và NIL trái mềm.

3. Cơ sở dữ liệu (Databases) & Website thực hiện nghiên cứu

Đây là các “kho báu” dữ liệu trực tuyến giúp tra cứu chú thích chức năng (Functional Annotations) và tải bộ gen tham chiếu của cà chua.

 Sol Genomics Network (SGN): https://solgenomics.net/

  • Vai trò: Đây là cơ sở dữ liệu cốt lõi và quan trọng nhất bắt buộc phải có cho nghiên cứu này. SGN lưu trữ toàn bộ bộ gen tham chiếu của cà chua (Solanum lycopersicum), phiên bản phổ biến hiện tại là SL4.0 cùng hệ thống chú thích gen ITAG4.0. Tại đây, các nhà nghiên cứu có thể tra cứu chính xác tọa độ vật lý của nhiễm sắc thể 3, tìm tất cả các gen nằm trong vùng qFF3.1 đã được fine-mapping.

NCBI (National Center for Biotechnology Information) https://www.ncbi.nlm.nih.gov/

  • Vai trò: * BLAST: Dùng để so sánh trình tự gen ứng viên tìm được với các loài thực vật khác nhằm dự đoán chức năng dựa trên tính đồng lôi.

    • Gene Ontology (GO) & RefSeq: Tra cứu chú thích chức năng chuẩn hóa của các protein liên quan đến độ cứng trái (như cấu trúc thành tế bào).

    • SRA (Sequence Read Archive): Nơi các nhà nghiên cứu tải dữ liệu RNA-seq thô của họ lên để lưu trữ quốc tế, hoặc tải về dữ liệu từ các nghiên cứu trước đó để đối chiếu.

Phân tích Con đường sinh học & Chức năng chuyên sâu

  • KEGG Pathway Database: https://www.genome.jp/kegg/ – Dùng để xem gen ứng viên thuộc con đường chuyển hóa nào (ví dụ: con đường phân giải pectin thành tế bào hay con đường sinh tổng hợp hormone Ethylene).

  • AgriGO v2.0: http://systemsbiology.cau.edu.cn/agriGOv2/ – Công cụ phân tích làm giàu thuật ngữ GO (GO Enrichment Analysis) chuyên biệt cho các loài cây trồng, giúp phân nhóm chức năng sinh học của hàng trăm gen DEGs thu được từ dữ liệu RNA-seq.Để thực hiện một nghiên cứu tích hợp từ lập bản đồ QTL cho đến phân tích cơ chế phân tử (RNA-seq) như trên, các nhà khoa học phải sử dụng một bộ công cụ kết hợp giữa phần mềm di truyền học số lượng, hệ thống xử lý tin sinh học (Bioinformatics pipeline)các cơ sở dữ liệu sinh học quốc tế.


Comments

Popular posts from this blog

Thể đa bội trên rau: khám phá di truyền cho sự tiến hóa cây trồng và công tác chọn tạo giống thành công

Phân tích đa dạng di truyền và GWAS về tính trạng vitamin C của cải xà lách (Lactuca sativa L.) với bộ chỉ thị SNP

Phân tích transcriptome tính trạng hình thành rễ nhánh sớm của cây cà chua