Essential Genes Encoding Conserved Metabolic Pathway Function in Autotrophic Solventogenic Clostridial Species

Info

Publication number: 20150191749
Type: Application
Filed: Mar 23, 2015
Publication Date: Jul 9, 2015
Inventors: Andrew Reeves (Chicago, IL), Fenglin Yin (Naperville, IL)
Application Number: 14/665,894

Abstract

Essential genes coding for the metabolic pathway of solventogenic autotrophic Clostridia were sequenced, and functionality was confirmed. The present invention utilizes a comparative inter-species approach to develop the minimum set of essential genes for metabolic function and estimate productivity in species of suspected solventogenic capability.

Description

Description

FIELD OF THE INVENTION

This invention relates to the cloning and expression of novel genetic sequences of microorganisms used in the biological conversion of CO, H₂, and mixtures comprising CO and/or H₂to biofuel products, and functional characterization thereof. Further, this invention relates to a method of prescreening autotrophic homoacetogenic microorganisms for the ability to produce high ethanol titers from syngas components.

BACKGROUND

Synthesis gas (syngas) is a mixture of carbon monoxide (CO) gas, carbon dioxide (CO₂) gas, and hydrogen (H₂) gas, and other volatile gases such as CH₄, N₂, NH₃, H₂S and other trace gases. Syngas is produced by gasification of various organic materials including biomass, organic waste, coal, petroleum, plastics, or other carbon containing materials, or reformed natural gas.

Acetogenic Clostridial microorganisms grown in an atmosphere containing syngas are capable of absorbing the syngas components CO, CO₂, and H₂and producing aliphatic C₂-C₆alcohols and aliphatic C₂-C₆organic acids. These syngas components activate Wood-Ljungdahl metabolic pathway 100, as shown in FIG. 1, which leads to the formation of acetyl coenzyme A 102, a key intermediate in the pathway. Under autotrophic fermentation conditions, the enzymes activating Wood-Ljundahl pathway 200, as shown in FIG. 2, are carbon monoxide dehydrogenase (CODH) 104 and hydrogenase (H₂ase) 106. These enzymes capture the electrons from the CO and H₂in the syngas and transfer them to ferredoxin 108, an iron-sulfur (FeS) electron carrier protein. Ferredoxin 108 is the main electron carrier in metabolic pathway 100 in acetogenic Clostridia, primarily because the redox potential during syngas fermentation is very low (usually between −400 and −500 mV). Upon electron transfer, ferredoxin 108 changes its electronic state from Fe³⁺ to Fe²⁺. Ferredoxin-bound electrons are then transferred to cofactors NAD⁺ 110 and NADP 112 through the activity of ferredoxin oxidoreductases 114 (FORs). The reduced nucleotide cofactors (NAD⁺and NADP⁺) are used for the generation of intermediate compounds in Wood-Ljungdahl pathway 100 leading to acetyl-CoA 102 formation.

The FOR-mediated ferredoxin reduction reaction additionally feeds an Rnf complex that maintains a proton-motive force (PMF) to generate ATP through interconnectivity of the electron-motive force (EMF) with the PMF since under autotrophic growth conditions homoacetogenic cells are generating net ATP through a PMF via an FIFO type ATP synthase consisting of seven genes (see Table 1, Gene ID Nos. 50-57). The net ATP generated through operation of the Rnf complex is then consumed for cell growth or maintenance.

Acetyl-CoA 102 formation through Wood-Ljungdahl pathway 100 is shown in greater detail in FIG. 2. Either CO₂202 or CO 208 provide substrates for the pathway. The carbon from CO₂202 is reduced to a methyl group through successive reductions first to formate, by formate dehydrogenase (FDH) enzyme 204, and then is further reduced to methyl tetrahydrofolate intermediate 206. The carbon from CO₂208 is reduced to carbonyl group 210 by carbon monoxide dehydrogenase (CODH) 104 through a second branch of the pathway. The two carbon moieties are then condensed to acetyl-CoA 102 through the action of acetyl-CoA synthase (ACS) 212, which is part of a carbon monoxide dehydrogenase (CODH/ACS) complex. Acetyl-CoA 102 is the central metabolite in the production of C₂-C₆alcohols and acids in acetogenic Clostridia.

Ethanol production from Acetyl CoA 102 is achieved via one of two possible paths. Aldehyde dehydrogenase facilitates the production of acetaldehyde, which is then reduced to ethanol by the action of primary alcohol dehydrogenases. In the alternative, in some homoacetogenic microorganisms, a bifunctional NADPH-dependent ADH/acetyl CoA reductase (“AR”) thioesterase facilitates the production of ethanol directly from acetyl CoA.

Wood-Ljungdahl pathway 100 is neutral with respect to ATP production when acetate 214 is produced (FIG. 2). When ethanol 216 is produced, one ATP is consumed in a step involving the reduction of methylene tetrahydrafolate to methyl tetrahydrofolate 206 by a reductase, and the process is therefore net negative by one ATP. The pathway is balanced when acetyl-PO₄218 is converted to acetate 214.

Acetogenic Clostridia organisms generate cellular energy by ion gradient-driven phosphorylation. When grown in a CO atmosphere, a transmembrane electrical and chemical potential is generated and used to synthesize ATP from ADP. Enzymes mediating the process include hydrogenase, NADH dehydrogenases, carbon monoxide dehydrogenase, and methylene tetrahydrofolate reductase. Membrane carriers that have been shown to be likely involved in the ATP generation steps include quinone, menaquinone, and cytochromes.

The acetogenic Clostridia produce a mixture of C₂-C₆alcohols and acids, such as ethanol, n-butanol, hexanol, acetic acid, and butyric acid, that are of commercial interest through Wood-Ljungdahl pathway 100. For example, acetate and ethanol are produced by C. ragsdalei in variable proportions depending in part on fermentation conditions. However, the cost of producing the desired product, an alcohol such as ethanol, for example, can be lowered significantly if the production is maximized by reducing or eliminating production of the corresponding acid, in this example acetate. It is therefore desirable to metabolically engineer acetogenic Clostridia for improved production of selected C₂-C₆alcohols or acids through Wood-Ljungdahl pathway 100 by modulating enzymatic activities of key enzymes in the pathway.

Acetogenesis as described above is a general metabolic trait that is not phylogenetically conserved. Therefore, production of liquid fuels via biocatalyst is the result of a unique collection of genes and functional protein activities that are expressed when grown in the presence of syngas under desirable growth conditions. Not all organisms that have the Wood-Ljungdahl pathway make ethanol, since some lack alcohol dehydrogenases or other genes to convert acetate to ethanol. Thus, the ability to convert syngas components to high ethanol titers is embodied in the unique collection of conserved genes described below.

SUMMARY OF THE INVENTION

The present invention is directed to an isolated and purified sequence encoding a series of polypeptides encoding polynucleotides which express the minimum set of required genes to maintain ethanologenic function, and which more particularly express the minimum set of required genes to maintain Acetyl-CoA to ethanol function and the minimum set of required genes to maintain Rnf complex function.

The present invention is additionally directed to a method of producing ethanol comprising: isolating and purifying anaerobic, ethanologenic microorganisms carrying the polynucleotides described above; fermenting syngas with said microorganisms in a fermentation bioreactor.

Further, the present invention is directed to a method of confirming high titer autotrophic solventogenesis function of a potentially commercially viable microorganism, said method comprising: sequencing the genome of said potentially commercially viable microorganism; comparing a resulting sequence of the genome of the microorganism to SEQ ID NO. 1.

Finally, the present invention is directed to a method of prescreening natural isolates with suspected autotrophic solventogenesis function for high ethanol titer potential, said method comprising: isolating and enriching a sample containing said natural isolates; subjecting said sample to a polymerase chain reaction using at least one set of degenerate primers capable of hybridizing to one or more of the genes of SEQ ID NO. 1; separating the amplified product of the polymerase chain reaction based on size; and determining the presence of said genes based on the results of said separation.

BRIEF DESCRIPTION OF THE DRAWINGS

FIG. 1 is a diagram illustrating the electron flow pathway during syngas fermentation in acetogenic Clostridia including some of the key enzymes involved in the process;

FIG. 2 is a diagram illustrating the Wood-Ljungdahl (C₁) pathway for acetyl-CoA production and the enzymatic conversion of acetyl-CoA to acetate and ethanol;

FIG. 3 is a diagram illustrating the metabolic pathway utilized by acetogenic clostridia. The pathway is understood to consist of all the electron transfer reactions involved in the extraction of electrons from CO an H2 to carriers which feed into the Wood-Ljungdahl pathway to form acetyl-CoA and eventually on to ethanol biosynthesis. Also integral to the whole process is the maintenance of a proton-motive force (PMF) to generate ATP and the interconnectivity of the electron-motive force (EMF)with the PMF since under autotrophic growth conditions cells are generating net ATP through a PMF;

DETAILED DESCRIPTION

The present invention is directed to novel genetic sequences coding for acetogenic Clostridial microorganisms that produce ethanol and acids from syngas comprising CO, CO2, H2, or mixtures thereof, and functional characterizations thereof.

Specifically, the present invention is directed to a minimum set of metabolic pathway genes of biocatalysts involved in conversion of syngas to ethanol under autotrophic growth conditions. Further, the present invention is directed to a process for prescreening autotrophic homoacetogenic microorganisms for the ability to produce high ethanol titers from syngas components.

Several species of acetogenic Clostridia that produce C₂-C₆alcohols and acids via the Wood-Ljungdahl pathway have been characterized: C. ragsdahlei, C. ljungdahlii, C. carboxydivorans, and C. autoethanogenum. The genomes of four of these micro-organisms were sequenced in order to locate and characterize the portions of the genome that code for the functions of interest, and that are conserved within the group of known organisms that produce high titers of ethanol when grown autotrophically on syngas.

The genes that code for the minimum set of metabolic pathway enzymes (including (1) electron transfer genes; (2) Wood-Ljungdahl pathway genes; (3) ethanol and acetate biosynthetic genes; and (4) energy [ATP] generation genes) are presented in Table 1. The first column identifies the broadly-categorized pathway associated with each gene. The gene identification numbers indicated in the second column correspond to the numbers representing the enzymes involved in the metabolic reactions in the pathway shown in FIG. 1. Any inclusion in an operon is noted in the fifth column.

TABLE 1 Gene EC Minimum Pathway ID Gene Name number Operon Set Description Monofunctional 1 Carbon Monoxide 1.2.2.4 RCCC01175 CO oxidation CODH 2 Dehydrogenase CODH RCCC02026 CO oxidation 3 RCCC02027 4 RCCC02028 Wood 5 CODH/ACS RCCC03874 acsA Ljungdahl 6 Carbon monoxide RCCC03873 cooC dehydrogenase accessory protein cooC 7 Formyltetrahydrofolate 6.3.4.3 RCCC03872 Methyl branch Synthase carbon fixation, fhs 8 Formimidotetrahydrofolate 4.3.1.4 RCCC03871 ftcd cyclodeaminase 9 Methenyltetrahydrofolate 3.5.4.9/ RCCC03870 Methyl branch cyclohydrolase/ 1.5.1.5 carbon fixation, fold Methylenetetrahydrofolate dehydrogenase 10 Zinc finger protein RCCC03869 unknown function 11 Methylenetetrahydrofolate 1.5.1.20 RCCC03868 Methyl branch reductase carbon fixation, metF 12 Dihydrolipoamide 1.8.1.4 RCCC03867 acoL dehydrogenase 13 Carbon monoxide RCCC03866 acsF, similar to dehydrogenase accessory cooC protein, ACS chaperone 14 Corrinoid/Iron-sulfur 1.2.99.2 RCCC03865 Part of protein CODH/ACS complex, Small subunit, acsD 15 Corrinoid/Iron-sulfur 1.2.99.2 RCCC03864 Part of protein CODH/ACS complex, Large subunit, acsC 16 Methyltransferase 2.1.1.13 RCCC03863 Methyl branch carbon fixation, acsE 17 Carbon Monoxide 1.2.99.2 RCCC03862 bifunctional Dehydrogenase/Acetyl- CODH/ACS CoA Synthase enzyme, carbon fixation, acsB 18 Formate Dehydrogenase 1.2.1.2 RCCC00874 Methyl branch 19 RCCC03324 carbon fixation Ethanol and 20 Acetate Kinase 2.7.2.1 RCCC01717 Acetate production acetate 21 Phospho-transacetylase 2.3.1.8 RCCC01718 Acetate production production 22 Tungsten-containing 1.2.7.5 RCCC00020 Reduction of aldehyde ferredoxin acetate to oxidoreductase acetaldehyde 23 Alcohol Dehydrogenase 1.1.1.1 RCCC01356 two pfam domain: FeADH and ALDH, AdhE 24 1.1.1.1 RCCC03300 one pfam domain: FeADH 25 1.—.—.— RCCC01567 short chain ADH, multiple copy 26 1.—.—.— RCCC02765 short chain ADH, multiple copy 27 Aldehyde Dehydrogenase 1.2.1.10 RCCC03290 Acetylating 28 1.2.1.10 RCCC04101 Acetylating 29 1.2.1.10 RCCC04114 Acetylating Hydrogenase 30 Hydrogenase 1.12.7.2 RCCC00038 Fe only, H2 production 31 1.6.5.3 H2ase 1 RCCC00878 NADH-quinone oxidoreductase chain E 32 1.6.5.3 RCCC00879 NADH-quinone oxidoreductase chain F 33 1.6.5.3 RCCC00880 NADH-quinone oxidoreductase chain G 34 RCCC00881 Electron transport protein hydN, Fe—S-cluster- containing hydrogenase components 1 35 1.12.7.2 RCCC00882 Fe only, large subunit, H2 production 36 RCCC00884 Electron transport protein hydN, Fe—S-cluster- containing hydrogenase components 2 37 1.6.5.3 H2ase 2 RCCC01502 NADH-quinone oxidoreductase chain E 38 1.6.5.3 RCCC01503 NADH-quinone oxidoreductase chain F 39 1.12.7.2 RCCC01504 Fe only, H2 production 40 1.12.5.1 H2ase 3 RCCC02998 Ni—Fe small subunit, H2 oxidation 41 1.12.5.1 RCCC02997 Ni—Fe large subunit, H2 oxidation 42 3.4.24.— RCCC02996 Hydrogenase maturation protease 43 RCCC02995 Hypothetical protein Electron 44 rnf Complex rnf RCCC01825 rnf B transfer 45 RCCC01826 rnf A 46 RCCC01827 rnf E 47 RCCC01828 rnf G 48 RCCC01829 rnf D 49 RCCC01830 rnf C Energetics 50 F0F1 type ATP synthase 3.6.3.14 ATPase RCCC00393 ATP synthase A chain 51 RCCC00394 ATP synthase C chain 52 RCCC00395 ATP synthase B chain 53 RCCC00396 ATP synthase delta chain 54 RCCC00397 ATP synthase alpha chain 55 RCCC00398 ATP synthase gamma chain 56 RCCC00399 ATP synthase beta chain 57 RCCC00400 ATP synthase epsilon chain Electron 58 Ferredoxin RCCC00086 Ferredoxin carriers 59 RCCC00301 Ferredoxin 60 RCCC00336 Ferredoxin 61 RCCC01168 Ferredoxin 62 RCCC02435 Ferredoxin 63 RCCC02890 Ferredoxin 64 RCCC03063 Ferredoxin

The results of the sequence analysis and the creation of the minimum set of functional genes for the four primary functions inherent in metabolic function of homoacetogenic Clostridia (electron transfer, Wood-Ljungdahl pathway, ethanol and acetate biosynthesis, and ATP generation) indicate that certain Clostridial strains (i.e. those with a low G+C) can be categorized according to their ability to make ethanol from different substrates and that organisms characterized by high ethanol titers must contain at a minimum the genes contained in the minimum set to maintain function and autotrophic ethanol production from syngas.

The comparison and creation of the minimum set additionally indicates that the key differences between high ethanol producing strains and strains producing no ethanol or low levels of ethanol (i.e. “smears”) lies in the electron transfer reactions and the large collection of alcohol dehydrogenases.

Two operons coding for CODH function were identified as members of the minimum set (see Table 1), indicating that both are essential for proper metabolic pathway function in any acetogenic Clostridia. One operon (Gene ID Nos. 2-4) codes for a monofunctional CODH which transfers electrons from a reduced CO to ferredoxin carriers. The two carbon moieties are then condensed to acetyl-CoA 102 through the action of acetyl-CoA synthase (ACS) 212, which is part of a carbon monoxide dehydrogenase (CODH/ACS) complex, and makes up the second CODH operon, which codes for Wood-Ljungdahl function (Gene 1D Nos. 5-18) that is conserved across known species of acetogenic Clostridia. The CODH/ACS operon is also responsible for reducing the carbon from CO2 208 to a carbonyl group 210.

Additionally, there are three further genes that do not reside in an operon that have been identified as members of the minimum set for Wood-Ljungdahl function: A fourth CODH gene and two formate dehydrogenase genes complete the minimum set.

Ten genes coding for ethanol and acetate production enzymes (Gene ID Nos. 20-29) have been identified as the minimum set for proper production by acetogenic Clostridia. These ten genes code for acetate kinase, phosphotransacetylase, tungsten-containing aldehyde FOR, and alcohol and aldehyde dehydrogenases, all of which are required for ethanol and aldehyde production from the primary metabolite in autotrophic acetogenic microorganisms, acetyl CoA. Aldehyde dehydrogenase facilitates the production of acetaldehyde, which is then reduced to ethanol by the action of primary alcohol dehydrogenases.

Two operons, one consisting of six genes (Gene ID Nos. 44-49) and coding for electron transfer function, and the other consisting of eight genes and coding for ATP generation were found to be conserved across all known autotrophic acetogenic Clostridia. Electron transfer function in acetogenic microorganisms is ultimately controlled by an Rnf complex which mediates EMF/PMF function. The Rnf complex maintains a PMF to generate ATP through interconnectivity of the EMF with the PMF since under autotrophic growth conditions homoacetogenic cells are generating net ATP through a PMF via an FIFO type ATP synthase consisting of seven genes (see Table 1, Gene ID Nos. 50-57). The net ATP generated through operation of the Rnf complex is then consumed for cell growth or maintenance.

Key genes to promote production of ethanol in solventogenic Clostridia include:

SEQ ID NO 1(Gene ID Nos. 1-64, Table 1), the minimum set of genes required to maintain function of the metabolic pathway of acetogenic Clostridia, including the experimentally determined promoter regions for all monocistronic genes and the promoter regions for the first gene in all operons.
SEQ ID NO 2 (Gene ID Nos. 20-29, Table 1), the minimum set of genes required to maintain function of the Acetyl-CoA to ethanol step of the Clostridial metabolic process, including the experimentally determined promoter regions for all monocistronic genes and the promoter regions for the first gene in all operons;
SEQ ID NO 3 (Gene ID Nos. 44-64, Table 1), the minimum set of genes required to maintain function of the Rnf complex and corresponding PMF to ATP step of the Clostridial metabolic process, including the experimentally determined promoter regions for all monocistronic genes and the promoter regions for the first gene in all operons;

Sequence Listing Minimum set sequences (TABLE 1) >SEQ ID NO. 1: (cooS, cooF, NADH: Ferredoxin Oxidoreductase operon (includes STOP) >GENE ID NO. 1: RCCC01175 Contig0001_4148927_4150588 CACGATTCTGTGGAAGAAATGCTTAAAAGAATCAGGGAAGATGGTATGTCAAACGTATTTGACAGAT GGTCCTCTCAAGAAAAAATTAGATGTAAGTTTTGCCTAGAAGGATTAAGCTGTCAATTGTGTTCTCA AGGTCCCTGCAGAATTAATCTTAAAGGAGAACAGAAAAAGGTGTTTGTGGTATTGGCCCAGATGCCA TGGCAATGCGAAATATGTTACTTAAAAACATAATGGGAGCTGGTACATATAGCCATCACGCATATGA AGCCTTTAGAACATTAAGAGAAACTGGAGAAGGCAAGACTCCATTTACAATTAAAGATGTGGATAAA CTCAAATGGATGTGCCAGAAAGTCGGAATTAATACAAGCGGAGATACCAATAAAATGGCAGTGAATC TGGCAAATTTTTTGGAAGCTGAGATGGGTAAAGATGTAGAAGAACCTAGTGTTATGGTAGATGTGTT TTCACCAAGAAAGAGAAAAAAAGTTTGGAAAGATCTTGGAATTTATCCTTCAGGAGTAGTTCACGAA GAGCAAAATGCAGTAGCAAGTTGTTTAACAAATGTTGATGGGGATTATGTATCATTAGCTAAAAAAG CGCTGCGGCTAGGTCTGTCAACTATCTATACAGCACAAATAGGACTTGAAATGGCTCAGGATATACT TTTTGGCACGCCTACACCCCATGAGGTAAATGTGGACTTAGGAATTATGGATCCAGAGTATATAAAT ATTGTATTTAATGGACATCAACCTTGGGCTGGTGTTGCTACTATTCAAAAGGCAAAGATGCAGCAGA TACAGGAAAGAGCAAAGGCAGCTGGTGCAAAAGGGCTTAGAATAGTTGGGTCAATTGAAACAGGACA GGAATTATTACAAAGATTTGAGGTAGATGATGTATTTGTAGGTTTAATGGGAGATTGGCTATCTATA GAACCACTTCTTGCTACAGGTACAGTTGATGTTCTTGCAATGGAAGAAAACTGTTCTCCACCTGCAA TAGATCATTATGCTGAAAAGTATCAGGTAACTTTAGTAGGTGTAAGTACTATTATAGGTATTCCGGG GTTAAATCATATGATTCCATATAATCCTGAAAAAGTGGGTGAAATGGCTGATAAATTGATTGATTTG GCCATTGAAAATTTTAAAAAGAGAAAGGATAACATTACACCAAAGGTTCCTAAAATAACACAGAAAG CAATAGCAGGGTTTTCTACTGAAGCAGTTTTAAAAGCTTTAGGAAATAAGCTTGATCCACTTGTTGA TGTTATTAAGGCAGGGAAGATTAAAGGAATTGTGGCTTTGGCAAATTGTTCAACTCTAAGAAATGGT CCTCAAGATTGGAATACAGTTAACCTGGTAAAGGAATTGATTAAAAAGGATATTTTAGTTGTGGCTG GTGGGTGCGGCAATCATGCTCTTGAAGTAGCAGGGCTGTGCAACCTAGATGCAATAAACATGGCTGG CCAAGGACTAAAAGAAGTATGCAATATGCTAAAGATTCCTCCAGTTCTAAGCTTTGGAACTTGTACA GATACGGGAAGAATATCCATGCTTGTTACAGAACTTGCTAATTACCTTGATGTAGATATACCAGATC TTCCTATTGCTGTAACGGCTCCTGAGTGGATGGAACAAAAAGCTACTATAGATGGTTTATTTGCAGT AGCCTATGGGACATATACACATTTATCTCCAACTCCATTTCTAACAGGCGCAGAACAGCTTGTAAAG CTTCTTACTGAGGATGTAGAGAGCTTAACAGGAGGTAAAGTTGCATTAGGAGATAATCCAAAAGAGG CAGCTGATAATATTGAAGCACATATATTAAGTAAAAGAAAGGGTTTGGAGTTATAA >Gene ID No. 2: RCCC02026 Contig0001_3297939_3296062 CAATTATTTTTTAGTTAGTTGTACTTGTAAATAAATAGTATTAATTAATACTATTAAACTATTACAG TTTTTGATTCTTAGTATAAGTATTCTTAGTATCTTTAGCACTTAGAATACGTTATCCTTTAGGAGAA TAATCCAATCAGTAATTTTAATAATTTAATAGTATACTTAAATAGTATAGTTTGGAGGTTTTATTAT GTCAAATAACAAAATTTGTAAGTCAGCAGATAAGGTACTTGAAAAGTTTATAGGTTCTCTAGATGGT GTAGAAACTTCTCATCATAGGGTAGAAAGCCAAAGTGTTAAATGTGGTTTTGGTCAGCTAGGAGTCT GCTGTAGACTCTGTGCAAACGGTCCCTGCAGAATAACACCTAAAGCTCCAAGAGGAGTATGTGGTGC TAGTGCTGATACCATGGTTGCAAGAAACTTTCTTAGAGCTGTAGCTGCCGGCAGTGGATGTTATATC CATATAGTCGAAAATACAGCTAGAAACGTAAAATCAGTAGGTGAAACCGGCGGAGAGATAAAAGGAA TGAATGCTCTCAACACCCTAGCAGAAAAACTTGGTATAACAGAATCTGACCCACATAAAAAAGCTGT ACTAGTAGCTGATGCCGTATTAAAGGACTTATACAAACCAAAATTCGAAAAAATGGAAGTTATAAAT AAATTAGCTTATGCACCTAGACTAGAAAATTGGAACAAATTAAATATAATGCCTGGCGGTGCAAAAT CAGAAGTTTTTGATGGTGTAGTAAAAACTTCTACAAATCTAAACAGCGACCCTGTAGATATGCTTCT AAATTGTTTAAAACTTGGAATATCCACTGGGATTTACGGACTTACCCTTACAAATTTATTAAATGAC ATAATTTTAGGTGAACCTGCTATAAGACCTGCAAAAGTTGGTTTTAAAGTTGTAGATACGGATTATA TAAATTTGATGATAACAGGCCACCAGCACTCCATGATTGCCCACCTTCAAGAAGAACTTGTAAAACC TGAAGCTGTAAAAAAAGCCCAAGCAGTTGGTGCTAAAGGATTCAAACTAGTTGGATGTACCTGTGTC GGACAGGATTTACAGTTAAGAGGTAAATACTATACTGATGTTTTCTCCGGTCATGCAGGAAATAACT TTACAAGTGAAGCCTTAATAGCAACTGGAGGTATAGATGCAATAGTATCTGAATTTAACTGTACTCT TCCTGGCATCGAGCCAATAGCTGATAAGTTCATGGTTAAAATGATATGCCTAGATGACGTTTCTAAA AAATCAAATGCAGAATATGTAGAATACTCTTTTAAAGATAGAGAAAAAATAAGCAACCATGTTATAG ATACGGCTATTGAAAGTTATAAGGAAAGAAGATCTAAAGTTACAATGAATATTCCTAAAAACCATGG CTTTGATGACGTCATAACAGGTGTAAGTGAAGGTTCCTTAAAATCCTTCTTAGGCGGAAGTTGGAAA CCTCTTGTAGACTTAATTGCTGCTGGAAAAATTAAAGGTGTTGCTGGAATAGTAGGTTGTTCAAACT TAACTGCCAAAGGTCACGATGTATTTACAGTAGAACTTACAAAAGAACTCATAAAGAGAAATATAAT TGTACTTTCTGCAGGTTGTTCAAGTGGTGGACTTGAAAATGTAGGACTTATGTCTCCAGGAGCTGCT GAACTTGCAGGAGATAGCTTAAAAGAAGTATGTAAGAGCCTAGGTATACCACCTGTACTAAATTTTG GTCCATGTCTTGCTATTGGAAGATTGGAAATTGTAGCAAAAGAACTAGCAGAATACCTAAAAATAGA TATTCCACAGCTTCCACTTGTGCTTTCTGCACCTCAATGGCTTGAAGAACAAGCATTGGCAGATGGA AGTTTTGGTCTTGCCCTTGGATTACCACTTCACCTTGCTATATCTCCTTTCATTGGTGGAAGCAAAG TGGTAACAAAAGTTTTATGTGAAGATATGGAAAATCTAACAGGCGGCAAGCTTATAATAGAAGACGA TGTAATAAAAGCTGCAGATAAATTAGAAGAAACCATACTTGCAAGAAGGAAAAGCTTAGGTCTTAAT TAA >Gene ID No. 3: RCCC02027 Contig0001_3296040_3295588 ATGAAAAGAATAATGATAAATAAGGATTTATGTACCGGATGCTTAAATTGTACTTTAGCTTGTATGG CAGAACACAATGAAAATGGGAAATCTTTTTATGATCTGGATCTCAGCAATAAATTTCTTGAAAGTAG AAATCATATATCTAAAGATGATAATGGAAACAAGCTTCCTATATTTTGCCGTCACTGTGACGAACCT GAGTGCGTAATGACATGTATGAGCGGTGCCATGACTAAAGATCCTGAAACTGGTATAGTATCCTATG ATGAGCATAAATGTGCCAGCTGCTTTATGTGCGTCATGTCCTGTCCTTATGGAGTATTGAAACCAGA TACTCAGACCAAAAGTAAAGTAGTTAAATGTGACCTGTGTGGTGACAGAGATACACCTAGATGCGTT GAAAATTGTCCAACAGAAGCAATTTATATTGAAAAGGAGGCAGATCTCCTATGA >Gene ID No. 4: RCCC02028 Contig0001_3295588_3294329 ATGAGTGGTTTAACAATAAAAATATTTTTTCACACAAAATATGTAATAATAGGAGCCAGTGCTGCTG GAATAAATGCTGCTAAAACTTTAAGAAAGTTAGATAAATCCTCCAAAATAACTATTATTTCAAAGGA TGATGCAGTTTATTCAAGATGTATACTCCACAAAGTACTTGAGGGAAGTAGAAATTTAGATACCATA AATTTTGTAGATTCTGATTTCTTTGAAAAAAATAATATAGAATGGATAAAAGATGCAGATGTAAGCA ATATTGATATTGACAAGAAAAAAGTCTTACTTCAAGACAACAGCAGCTTCAAATTTGACAAGCTCCT TATAGCTTCTGGTGCTTCCTCCTTTATTCCCCCAGTTAAAAAATTAAGAGAAGCTAAAGGAGTGTAC TCCCTTAGAAATTTTGAAGATGTAACTGCTATACAAGACAAACTTAAAAACGCAAAACAAGTGGTAA TACTTGGTGCAGGTCTTGTAGGAATTGATGCACTTTTAGGTCTTATGGTGAAAAATATAAAGATTTC AGTTGTAGAAATGGGAGATAGGATTCTCCCCCTTCAACTGGACAAAACTGCATCCACTATATATGAA AAGTTGTTAAAAGAAAAAGGTATAGATGTCTTTACTTCAGTTAAATTGGAAGAGGTAGTTTTAAATA AAGACGGAACTGTAAGTAAAGCAGTACTATCAAATTCAACTTCTATAGATTGCGATATGATAATAGT TGCTGCTGGTGTTAGACCAAATGTAAGCTTTATAAAAGACAGCAGGATAAAAGTTGAAAAAGGCATT TGTCATAGACAAACATTGTAAAACCACTGTAGATAAATATATGCTGCAGGAGATGTTACTTTTACTG CTCCTATATGGCCTATAGCTGTAAAGCAGGGAATAACTGCTGCTTACAACATGGTAGGTATAAATAG AGAATTACATGACACTTTTGGCATGAAGAACTCAATGAATTTATTTAACCTTCCATGCGTATCCCTT GGTAATGTAAATATAGCAGATGAAAGTTATGCTGTTGATACATTAGAAGGAGATGGAGTTTATCAAA AAATAGTTCACAAAGATGGAGTAATCTACGGTGCACTTCTAGTTGGAGATATATCTTACTGCGGCGT ACTAGGATATCTCATAAAAAATAAAGTAAATATAAGCAATATCCATAAAAATATTTTTGACATAGAT TATTCTGATTTTTACAATGTTGAAGAAGATGGACAATATAGTTATCAATTGAGGTAA >Gene ID No. 5: RCCC03874 Contig0001_1807911_1806019 TTATACTTAAATGGATGTTTATTTTTTAACATTTTTTATGGTAAATATATTTATTTTATGTAGTAAA AAGGTTATAATTATAATTGTATTTATTACAATTAATTAAAATAAAAAAATAGGGTTTTAGGTAAAAT TAAGTTATTTTAAGAAGTAATTACAACAAAAATTGAAGTTATTTCTTTAAGGAGGGAATTATTAAAA TGGAAGAAAAGGCAAAGTCAATTGATCAAGCTACTTTACAATTATTGGACAAGGCAAAAAAAGATGG GGTTGAAACTGCTTTAGATAGGAAAGCAGACATGAAGGTACAGTGTGGATTTGGGTCAGCAGGAGTT TGCTGTAGAAATTGCAGCATGGGTCCTTGTAGAGTAAGTCCAGTGCCCAGGAAAAGGCGTTGAAAGA GGTATATGTGGTGCTACAGCAGATGTAATTGTATCTAGAAATTTTGCAAGAATGGTTGTAGGCGGAG CTGCTGCACATTCAGATCATGGTAGAAGTATAGCACTTAGCTTATACCACTCCAGCAAAGATGGAGA TATAAAAGTTAAAGATGAAAATAAATTGAAAGAAGTTGCAAAAATATATGATGTAGAAACTGAAGGA AGAGACATATATGATATAGCTCATGATGTAGCTAAAAGAGGATTAGATGATTATGGTAGACAAATGG GAGAAGTTAAACTTCCACCGTCCCTTCCACCAAAGAGAAAGGAAATATGGGATAAACTTGACATAGT TCCAAGGGCAATTGATAGAGAAATAGCTGCAGTTATGCACTCAACACATATAGGATGTAATGCAGAT GCAGAAGCTATGATTAAAATGGCTATGAGATGTTCGCTAGGTGATGGATGGCTAGGATCATATATGG CTACAGAATTTAGAGATATAATGTTTGGAACACCTAAGTCAATTGAGACAGAAGCAAATCTTGGAGT ACTTGAAAAGAATTCTGTAAATGTAGTTTTACACGGACATGAACCTCTTCTTTCAGATATGATAGTA GAAGCAGCATCAGATCCAGAACTAGTTGAACTTGCTAAATCAGTAGGTGCTGATGGAATAAACTTAT GCGGAATGTGCTGTACTGGAAATGAAGTTTCCATGATACATGGCATCAAAATAGCAGGAAACTTTAT GCAGCAGGAATTGGCTGTAGTTACAGGAGCAGTAGATGGACTTATAGTTGATGTACAGTGTATAATG CCAGCATTAGCAAAATTGACTAAGTCATATCATACTAAGTTTATAACGACTTCACCAAAGGCACATA TCACAGATTCAACTTATATTGAATTTGATGAAGAACATCCACTTGATTCTGCTAAACAGATTTTAAA GGAAGCAATATTAAATTTTAAAAATAGAGATAACAGTAAAGTAATGATTCCTGAATTGAAATCAAAG GGAATTGTAGGATATAGTGTTGAAGAAGTAATAAACAAATTGGACAAAGTTGTTAATACACAAATAG GACCAATGCAAACTGTAAAGCCTTTAGCAGATGTTTTAGTATCAGGAGTATTAAGAGGTGCCGCAGG TGTAGTTGGTTGTAACAATCCTAAAGTTACTCATAATTCTGCACATATTGAAACTATAAAGGGATTA ATAAAGAATGATGTAATAGTTGTTGCTACAGGTTGTGCAGCTCAAGCAGCAGCAGAATATGGATTAA TGCAATTAGAAGCAGCAGAAAAATATGCAGGACCAGGACTAGCTACTGTATGTAAGCTTGTTGGTAT ACCACCAGTACTTCATATGGGTTCTTGTGTTGATATAAGCCGTATATTAGACTTAGTTGGTAGAGTA GCTAATTTCTTAGGTACAGATATGAGTGATCTTCCAGTTGTAGGTGTAGCACCTGAATGGATGTCAG AAAAAGCTGTTTCTATAGGTACTTATGTAGTAACTTCAGGTATAGATACTTGGCTTGGAGTAACACC TCCAGTAACAGGCGGTCCAGAAGTTGTAGATATTCTTACTAATAAGATGGAAGACTGGGTAGGAGCT AAATTCTTTATAGAAACAGATCCTCATAAAGCAGTTGAACAAATGGTTAATAGGATGAATGAAAAAC GTAAAAAATTAGGTATCTAA >Gene ID No. 6: RCCC03873 Contig0001_1805723_1804944 TCAAAGTGATATGAAGTCAAGATTACATATCATTTTGAGAAGAATTTTAATTTATAGATGGTATAAT GTAGAATAAAATTTATAATTTATCTACAAATACATAAATTATAAGGGAATATATTTGTAGATAAAAG TATATATTAAGTTTGTATTTTAAATAAATTATATAAAATGGTTGTTCAAAATGGGAGGGACTACATA TGAAAATGAAAATGGCTATAACAGGTAAAGGTGGTGTAGGTAAAACTACATTTTCAGCGATAATGAG TAGAATATATGCAGAAGAAGGATATAATGTTTTAGCTGTGGATGCAGATCCTGATCCCAATTTGGCA TTAGCATTAGGATTTCCAAAAGAGATAGCAGATGAGATTGTTCCAATTTCAGAAATGAAAAAGTTAG TAGCAGAGAGAACAAATTCTACTCCAGGATCCTTTGGAAAAATGTTTAAAATAAATCCTAAAGTTGA TGATATACCAGAAAGATATTGCAAGGAATACAAAGGTGTAAGACTTTTAACTATGGGAACAGTTGAT ACAGGCGGAACAGGTTGTTTCTGCCCGGAAAATGTTTTGCTTAAAAAACTCACGTCACATTTAATGC TCCAAAACAAAGATATCGTCATAATGGATATGGAAGCAGGTATTGAACATTTGGGAAGGGGAACAGC GCAAGGTGTAGATGTATTTATTGTTGTTGTAGAACCTGGAATAAGAAGTATACAGACGTTCAAGCAT GTTAAAAAATTAGCTAAGGATATAGGAATAGAAAAGATATTTGTGGTAGCAAATAAAATTAGAAATA AGAAGGACGAAGAATTTGTATTGGAAAATGTAGATAAAAAGAATGTCTTGGATTTATACATTATAGT GACACAGTTGGAAGTTCTGATAGAGTCAATCAATCTCCTTACGATTCCAATGAGGAAACTGTTAAGG AGGTAAAAAATATAAAACAAAAATTAGAAATGGGGGTTTTTTAA >Gene ID No. 7: RCCC03872 Contig0001_1804940_1803267 ATGACTTATAAATCAGACATCGAAATAGCTCAAGAATGCACAATGAAGGACATTAAGGAAATTGCAA AGAAATTAAATATTTCCGAAGATGATATTGAATTGTATGGTAAATACAAAGCAAAGGTAAATTACAA CTTGTTAAAGACTACACCTGGAAAGAATGGAAAACTTATATTATGTACAGCTATAAACCCAACACCT GCTGGAGAAGGAAAAACTACTACAGCAATAGGTGTAGCAGATGCATTAAATAGAATGGGAAAATCTG TTGTTGTTGCACTTAGAGAACCATCTATGGGACCTGTATTTGGTATAAAAGGTGGAGCTGCCGGTGG TGGATATGCTCAAGTAGTACCTATGGAAGACATAAACCTACACTTTACAGGTGATATACATGCACTC ACTGCTGCTAACAATTTACTTGCAGCAATGATAGATAATCATATATATCAAGGCAATAAGCTTAACA TAGACCCAAGAAGAATTGCTTGGAGAAGATGCGTAGACATGAACGACAGACAGCTCAGGTTTGTAGT TGATGGATTAGGTGGAAAAGCCAATGGTACACCTAGAGAAGATGGATTTGATATAACAGTTGCTTCA GAAATAATGGCTATATTCTGTTTATCAAGTGACATAATTGATTTGAAGAAGAGAATTGCTAAAATAG TTGTAGGATACACTAGAGATGGCCAGCCTGTAACAGCTCATGATTTGAAAGCTGAAGGAGCTATGGC AGCACTTCTTAAAGATGCATTAAAACCAAATCTAGTTCAAACTCTTGAAGGAACACCAGCATTTGTA CACGGCGGACCATTTGCAAATATAGCTCATGGTTGTAACTCAATAATGGCTACTAGAATGGCTCTTC ACTTTGGTGATTATGTAGTTACGGAGGCAGGTTTCGGTGCTGACCTAGGTGCTGAAAAATTCTTAGA TATCAAGTGCAGAATGGCAGGATTAAAACCAGATGCAGTAATAATAGTTGCTACAGTTAGAGCATTG AAATACAATGGCGGAGTTCCAAAGGCTGACTTAAATAATGAAAACTTAGAAGCTCTTGAAAAAGGAC TTCCAAATCTATTAAAACATGTAGAGAATATAACTAAGGTATATAAATTACCAGCAGTAGTTGCATT AAATGCATTCCCTACAGATACACAGGCAGAATTAAAATTAGTAGAAGATAAATGTAAAGAATTAGGT GTAAATGTAAGATTATCAGAAGTTTGGGCTAAAGGCGGCGAAGGTGGACTAGAAGTTGCCAAAGAAG TGCTTAGACTTATAAAAGAAGAGAAAAATGACTTCCAGTTTGCTTATGATGAAAAATTACCAATTAG AGATAAAATAAGAGCAGTAGCTCAAAAGATATATGGTGCTGATGATGTTACTTTCACAAGTCAGGCA GAAAAAGAAATTGATGAGCTTGAAAAATTAGGATTTGGTAAAACACCAGTATGTATAGCAAAGACCC AATACTCCTTAACTGATGACCAGACTAAACTTGGAAGACCAACAGGATTTAATATTACAGTAAGACA GGTTACAATTTCTGCTGGAGCAGGTTTTGTAGTTGCAGTAACTGGTTCAATAATGAAGATGCCAGGT CTTGGAAAAGTTCCATCTGCTGAAAAAATAGATGTAGATGAGAATGGAGTAATAAGCGGATTATTCT AA >Gene ID No. 8: RCCC03871 Contig0001_1803243_1802614 ATGAAATTAGCAGATAAAAGTTGCACAGATTTTATAGAAGTTCTTGCATCTAAAGCTGCAACTCCTG GTGGAGGCGGAGGATCAGCTATTACAGGTGCTATAGGAATGGCACTTGGAGGCATGGTATGTAACCT TACAATAGGAAAGAAAAAGTATGCACAGTATGATGAAAAGGTAAAAGGCATACTTAAAAGATCTGAT GAGCTTCAAGCAGAGCTTTTAAAGATGATGGATGCAGATGCAGAATGCTTTCTGCCTCTTTCAAAGG CTTATGGAATGCCAAAAGACACTGAAGAGCAGAAAAAAATAAAAGAAGAAACTCTAGAAAAGTGTCT AAAGCAAGCATGCAGTGTTCCAGTAAGCATTGTTAAGCAAGCTTATGAAGCAATAAAACTCCACGAG GCACTTGTAGATAACTGCTCCAAACTTGCAATAAGTGATGTTGGTGTAGGAGTTCAGTGTCTAAGAG CTGCTATTATTGGAGCACAGCTTAATGTCATAATCAACATTAATTCCATTAAAGATCAGGAATATGT TAAAAAGGTAAAAGCAGAGACGGAACCTTTAGTTGAAGAAGGCATTAAGATTGCAGATAAGGTATAT GAAAAAGTAGTTAGTGCACTTTCCAAATAA >Gene ID No. 9: RCCC03870 Contig0001_1802508_1801657 ATGGGTCAAATAATTAAAGGTAAACCAGTGGCAGATGCTATAAGTGAAGCTTTAACTAAAGAAGTTA ATGATTTAAAGGTAAAGGGTATTACTCCAAAACTTACATTAGTAAGAGTTGGAGCAAACGGAAGTGA CCTTGCTTATGAAAAAGGAGCTCTAAAAAAGTGCGAAAAAATTGGAATAGAGGCAGTTGTTAAAGAG CTACCAGCAGATATATCACAAGACAAGTTTATTGAAGAATTGAAAAAAATAAATGCGGACAAGACTG TAAATGCAATAATGGTATTCAGACCATTTCCTAAGCAATTAGATGAAAGCGTTATAAAATATATAAT CGCCCCTGAAAAAGATGTAGATTGCTTTAGTCCTGTAAATGTTGCTAAATTGATGGAAAAAGATATG ACAGGATTTGCACCTTGTACACCATCTGCTGTTATAGAAATCCTTAAGCATTATAAAGTTCCTATGA AGGGAAAGAATGCAGTTATAGTAGGAAGATCTATGGTAGTTGGAAAACCAGCGTGCATGCTCCTATT AAATGAAAATGCTACAGTTACCGTATGTCATTCAAAAACTACTGATATGCCAAAGGTTTGTTCCCAG GCAGACATACTGGTAGTAGGCATAGGAAAAGCTAAAATGATAGATTCAAAATATGTAAAAGATGGTG CCGTAGTTATAGATGTAGGCATAAATGTAGATGAAAGTGGAAAGCTATGTGGAGATGTAGATACAGA AGACTGTGAATCAAAAGCTTCAATGATAACACCTGTTCCTAAAGGAGTAGGCTCTGTTACATCATCT ATACTTGCACAGCATATTGTAAAGGCCTGTAAGTTACAAAATAACCTATAA >Gene ID No. 10: RCCC03869 Contig0001_1801626_1800979 ATGATTATTTCAGAAAAAAAATCTTTTGATGAATTATTGGATTACCTTAAAGACAGTGAAAAAGTAA TAATCACAGGATGTTCTTTATGCGCAACTACCTGTAAAGTAGGCGGAGAAGAAGAAGTATTAGCAAT GAAAGCCAAGTTAGAAGAACAAGGCAAAAAAGTTTTAGGCTATAAAATACTTGATCCTTCCTGCAAT CTTTTAAAAACAAGAAAAGATTTAAAGTCCTTAAAAGCTGAATTAAAAGAAGCAGATGCAGTAGTAT CCCTAGCTTGTGGTGATGGAACTCAAACTGTAGCCAAGTTAGTAAAGATTCCCGTTTATCCAGGTAA TAACACTATGTTTATAGGCGAAGTAGAAAGAGTTGGACAATATGCAGAAGCTTGTAAAGCTTGTGGA AATTGCCAGCTTGGATGGACAGGGGGAATATGTCCAATTACAATGTGTGCAAAGGGACTTTTGAATG GACCTTGCGGTGGTGCAAGAGATGGTAAATGTGAAGTTGATCCTGAAAATGATTGTGCTTGGATATT AATATACAATAAATTAAAAGAACTAGGACAGCTCGATAATTTGACAGAATTAAGAAAGCCAAGAGAT TATCAAATAAGTGCTCATCCTAGAAAAATAAATTTAAATGCTAAGTAA >Gene ID No. 11: RCCC03868 Contig0001_1800953_1800075 ATGAGCTTATTGAAGGAAGCTTTTGAAAAGGGAGAGTTTGCAGTTACAGCTGAAATGGCACCTCCAA AGGGAACGGATCTTTCTCATTTAATTGAATGTGCCAAAAAGATAAAAGGAAGAGTTCATGGAGTTAA TGTAACGGATTTTCAGTCTGCTACGTTAAAAGCTACATCTTTAGCTACTTGTAAAGTGTTAAAAGAT GCAGGATTAGAACCTGTATTTCAAATAACAGGAAGAGATAGAAACAGAATAGCAATTCAAGGAGAAT TGTTATCTGCAGGTGTTTTTGAAATTGAAAATGTTTTAGCTCTTACTGGAGATTATACTGCTACAGG AGATCACCCTGGTGCAAAGCCAGTTTATGATCTAGATAGTGTTGGAATATTACAGGTGGCAAGCATT TTAAATGGCGGAAAAGACATGGGTGGAACTGATTTAAAAGGGAAACCAGATTTCTTTTTAGGGGCCT GTGTTACACCTAGATATGATCCGTTAGAGCTTCAAGTTATAAAGATGAAGAAGAAAATTAAAGCTGG AGCTAAATTCTTTCAAACTCAAGCTGTTTATGATATGGAAACTTTAAAGAAATTCAAAGAAGAGACT AAAGCTCAAGGTGTAGATGCTAAAGTTATGGTAGGCATAATACCTTTAAAGTCAGCTGGTATGGCTA AATACATGAATAAAAACGTGCCTGGTATATTCGTACCTGATGAACTTATAGATAGAATGAAAAATGC TGAGGATAAAGTTCAAGAAGGCATAAAGATAGCAGGAGAATTTATAAAGGCCGTAAAAGAATCAGGA CTTTGCGATGGAGTTCATATAATGGCAATTGGTGCGGAAGAAAATGTGCCATTAATATTGGACGAAG CAGGATTATAA >Gene ID No. 12: RCCC03867 Contig0001_1800037_1798658 ATGAAATTAGTTGTAATTGGTGGAGGACCAGGAGGATATGTAGCTGCACTGCAAGCTGCAATTTTAG GAGCAGATGTTACTGTAGTTGAGAAGAAAGCTGTAGGAGGAACTTGCTTAAATGTAGGATGTATACC TACAAAAGCACTGCTTGCTTCCACAGATGTTTTAAGTGTAATAAAAGGAGCATCAAAATTTGGAATT AATGTTGAAGGTGAAGTAAAACCTGATTTTGATGCAATTATGAAGAGAAAAGATAAAGTAGTAGATC AACTTGTAAAAGGCATAGAATATATGTTTGAACATAGAGGGGTAAAGCTTATAAGGGGAACAGGAAA ACTTATAAGCAATAAAGAGGTAGAGGTTACAAAGCAGGATGGATCTAAAGAATCCATAACGGCAGAT AAAATTATACTTGCTACTGGTTCTGTACCTGTTACACCTGGAGTATTCAAGTATGATGGTAAAAAGG TTATAACTTCAGATGAAGTTTTGAATTTAGAGAAACTTCCAAAGTCAATGATACTAGTTGGTGGAGG TCCTATAGGATGTGAAATAGGATTCTTCTTAAATAGTATGGGAGTAGAAGTTAAGGTAGTTGAAGCT CTTCCACATCTTGCACCACTTGAAGATGAAGATGTTGCAAAACAACTTCAGAGAATTTTCAAACAGC ATAAGATTAAATACTTTGTAGGCGATGGTATAACTAGTGTAGAAGTTAAAGGTGATACGGTAACTGC TACATTGGGAAGCGGAAAAGTTTTAGAGGCTGAAACACTTCTCATAGCAGTTGGAAGAAGAGCTTAT GCTGAAGGTTTAGGTTTGGATGATATTGGTATTAAGAAAGATCAAAAAGGAAGAATAATTGTAAATG AATATTTAGAAACTAATGTAGAGGGAGTTTATGCAATAGGTGATTTAATTCCTACTGCTGCTCTTGC ACATGTAGCTGAAAGAGAAGGTATTGTAGCTGTTCAAAATGCAGTTTTAGATAAAAAGAAGAAGATG AGTTACAAAGCAGTACCTGGTTGTACATTTGTAGAACCAGAAATAGCTTCTGTAGGTATGAAAGAGA AAGATGCTGAAAAAGCAGGAATCCAGTACAAGGTTGGAAAATTTGACTTTAGGGGGCTTGGAAAAGC TCAAGCTATGGGTAAATTACAAGGATTTGTAAAGATTATTACAGACGAAAAGGACGTAATAATTGGA GCTGCTATTGTAGGTGATAGAGCAACAGATATGATTTCAGAATTAGGTGTTGCTTGTGAGCTTGGTT TAACAGCAGAACGAGTTGGTGAAGTTATTCATCCACATCCGACTTTATCTGAGGCAATGATGGAAGC TCTTCATGATGTACACAAACAATGTGTTCATTCTGTTGATTAA >Gene ID No. 13: RCCC03866 Contig0001_1798516_1797746 ATGGGATATAAAATAGCTGTAGCAGGTAAGGGTGGTACCGGCAAAACTACTTTGACAGGTCTTTTAA TAGATTATTTGACAAAAAAAGGTTCAGGACCTATTTTAGCAGTAGATGCTGATGCAAATGCTAATTT AAATGAAGTACTTGGAACAGACATTGAGGAAACTATTGGAGAAATAAAAGAGGACGTAAATAAAAAA TCACTTGAAGGGGATAATTTTCCTGGAGGTATGATGAAAGCAGATTATTTAAAGTATAAATTAAATG CATCAGTAGCTGAAGGAGACGGTTATGACCTTATTGTTATGGGAAGATCCCAGGGGCCAGGATGTTA TTGTTATGTTAATGGAATACTTAAAGCACAAGTGGATTCACTTTCTGGTAATTATGATTACATAGTA GTTGATAATGAAGCAGGAATGGAACACTTAAGTAGAAAACTTATAGATCCTATTGATACTCTATTTC TGATAAGCGATTGTTCCAGAAGAGGCATACAGGCTGTTGGAAGAATAAAACGGTTAGTTGCTGAATT AAAGTTAAAAGTTGGCCAAATCTTTCTTATCGTAAATAGAGCTCCAGAAGGTAAATTGAATTCAGGA ATAAAAGAAGAAATAAAAAAGCAAGAACTGGATTTAGTAGGAGTTGTGCCGATGGACCAAATGGTCT ATCAATTTGATTCAGATGGAAAAGCATTAGTAGAGCTGCCAGAGGATTCTTCATGCAGAAAAGCATT GAATGAAATACTATCAAAAATTCAATTTGAAAATTAA >Gene ID No. 14: RCCC03865 Contig0001_1797724_1796783 ATGTTCAAAAAACCAACACAAAAATTTTCAGGCAAAATTGGTGAAGTTGAAATTGGAACAGGAGAAA AAGTATTAAAATTAGGAGGAGAATCAGTATTACCATTTTACACTTTTGATGGAGATACAGGAAATAG CCCAAAAGTAGGTATGGAAATTTTGGATGTATATCCAGAAGACTGGATAGATCCTTTAAAAGACATA TACAAGGATGTTGCAAAAGATCCTGTTAAATGGGCACAATTTGTAGAAGAAAAATATAGTCCAGATT TTATATGCCTAAGACTTATAAGTGCTGATCCAAACGGTACAGATGCTGCACCAGAAGATTGTGCTAA AACAGCTAAAGCAGTAGTTGAAGCTATAAAAACTCCATTAGTAGTTGCAGGTACAGGAAATCATGAA AAAGATGCAAAATTATTTGAAAAAGTTGCTCAGGAAACTGAAGGACACAATATACTTTTAATGTCTG CAGTAGAAGATAATTATAAGACAGTAGGAGCTGCAGGCGTAATGGCTTATAATGACAAAGTTGTAGC TGAATCTTCAGTTGATATAAACCTTGCAAAACAGATAAATATTTTAATGAATCAACTTGGAATAGAC AATACAAAGTTTGTTGACAACGTAGGATGTGCAGCAGGTGGATATGGTTATGAATATGTTATATCAA CTTTAGACAGAGTAAAACTTGCAGCACTTGGTCAAGATGATAAAACTCTTCAAATTCCTATAATAAG CCCTGTTTCTTTCGAAGCTTGCAAAGTAAAAGAAGCAATGGATTCAGAAGAAGATTCACCACAATGG GGAAGTCAGGAAGACAGAACAGTTTCCATGGAAGTTGCAACAGCATCCGGAGTATTAGCATCAGGAA CAGATGCTGTAATATTACGTCATCCAAAATCTGTAGAAGTAATTAGAAATTTTATTAAGGAATTATT AGGTTAA >Gene ID No. 15: RCCC03864 Contig0001_1796741_1795392 ATGGCTTTAACAGGATTAAATATATTTAAATTAACACCAAAAAAGAATTGTAAGGATTGTGGTTTTC CTACTTGTCTAGCTTTTTCAATGAAAGTAGCAGCAGGAGCTGTGGAAATAGGAAAATGTCCTCATAT GAGTGATGAGGCAATGGAAAAATTAGCTGAAGCTACTGCACCAATTATGAAGACAATAACTATTGGT AAGGGAGATAATGAATATAAATTAGGTGGAGAAACTGTTTTATTCCGTCATGAAAAAACTTTTGTAA ATAGAAATAGATTTGCAGTTGCATTTTCCGATAGTATGGATGATGCAGAAGTAGATGCTAAGATCCA ACATATAAAAGATGTAGATTATGTTAGAATCGGTGAACAAATGAAAACCGAATTTGCTGCAATAAAA TATGCAGGAAATAAAGACAAATATCTTGCTTTGATAAATAAAATAAAAGCAAGTGGAGTAAAAGTAG CTTATGCTCTAGTTTGTGAAGATGCAGCAGTAATGAAAGAAGCTCTTCCACTAGTTAAAGATGAAAA TCCATTAGTTTATGGAGCTAATAAAGATAACTTCAAAGAAATGGTTGAACTTGTAAAAGAAGATAAA TTAGCTTTAGGTGTAAAGGCAGACGGATTGGAAGCTCTTTATGGTTTAGTAGAAGAAATACAAAAAT TAGGATATAAGAACTTAGTACTTGATCCAGGTGGAAAATCCATTAAAGAAGCTTTTGAAAATACAGT TCAAATTAGAAGAATAAATATTGAAAATCAGGATAGAACTTTTGGATATCCTTCTATACTATTCCTA GATGAACTTACTAAAGCTGATAAATTTATGGAAGTAGCTTTATCTACATTATTTACTTTGAAATATG GTTCATTACTTGTTTTAAGTGATATGGATTATGCAAGAGCACTTCCTCTTTATAGTATAAGACAGAA TGTATTTACAGATCCACAAAAGCCAATGACAGTTGATTTGGGCATACATGGAATTAACAACCCAGAT GAAAACTCACCAGTATTATGTACTGTTGACTTTGCTCTTACTTACTTCCTAGTTTCAGGAGAAGTTG AAAGATCTAAAGTTCCAGTATGGATGGTTATACCAGATGCAGGTGGATATTCTGTTCTTACATCTTG GGCTGCAGGTAAATTTACTGGTGCTGCAATAGCTGATGAAATAAAGAAATGTGGAATATCAGAGAAG ACTAAGAACAGAACTCTTTTAATCCCAGGAAAGGTTGCAGTTTTGAAAGGCGAATTAGAGGAACTTC TTCCAGACTGGAATATAGTAATTAGTAGTACAGAAGCTATGTTTATTCCTAAGTTATTAAAAGAGTT AACTGCTAAGTAA >Gene ID No. 16: RCCC03863 Contig0001_1795278_1794496 ATGGATAAATTTATGATTATAGGCGAAAGAATTCACTGCATATCTCCATCTATAAGGAAGGCTATTG AGGAGAGAAATCCTGAACCAATATTTAAAAGAGCAAAAGAACAATTGGATGCAGGAGCTAATTATCT AGATTTTAATATAGGACCAGCAAGAAAAGATGGAGAAGAAATAATGCAGTGGGGTGTTAAGGCTCTT CAAAGTGAATTTGACAATGTTCCACTAGCACTTGATACAACAAATAAGAAGGCTATAGAGGCAGGAC TTAAAGTTTACAATAGAGAAAAAGGAAAACCTATCATAAATTCTGCAGATGCAGGAGAAAGAATTGG AAATATAGATTTAGCTGCAGAGTATGATGCTATGAGCATAGCTCTTTGTGCAAAAGAAGGAATAACA AAAGACAATGATGAAAGAATAGCATATTGTACAGAAATGCTTGAAAAAGGTATGGGTCTTGGAATGG AGCCTACAGATTTACTGTTTGATCCATTATTTTTAGTAATAAAGGGCATGCAGGATAAACAAAAAGA AGTATTAGAGGCTATTAAATTAATAAGTGATATGGGTCTTAGAACTTGCTGTGGATTAAGCAATGTT TCAAATGGAGCACCTAAGGAAATAAGACCAATAATGGATGCAACTTTTGCAGCTATGGCAATACAAT GTGGTCTTACTTCTGCAATAATGAATCCATGTGATAAGAGATTAATGGAGACAATAAAGACTTGTGA TGTTGTAAATGGTGCTGTTTTATATGCAGATTCTTACTTAGATTATAA >Gene ID No. 17: RCCC03862 Contig0001_1794434_1792311 ATGAATTTATTTCAAACTGTATTCACTGGTTCAAAGCAGGCTTTAGCAGCTGCTGAAGGCATAGTTA AGCAAGCTGTTGACGAGAAGGGTAGAGACTATAAAGTAGCATTTCCTGATACTGCATATTCATTATT AGTAATTTTTGCAGCTACAGGAAAAAAGATAACTAATGTAGGAGAATTAGAAGGTGCATTAGATATA GTAAGAAGTTTGATAGTTGAGGAGGAAATGCTTGATAAGCTTTTAAATTCAGGACTTGCAACAGCTG TTGCAGCAGAAATTATAGAAGCTGCAAAGTATGTCCTTTCAGATGCTCCTTACGCAGAACCATGTGT AGGATTTATCTCAGATCCAATAATTAGATCATTTGGAGTACCACTTGTTACAGGTGATGTTCCAGGT GTAGCAGTTGTACTTGGAGAATTCCCAGATTCTGAAACTGCAGCAAAAGTAATAAAGGATTACCAAT CAAAAGGATTACTTACTTGTTTGGTAGGCAAAGTAATAGATCAGGCTATAGAAGGCAAAGTTAAGAT GGGACTTGACCTCAGGGTTATTCCACTTGGATATGATGTTACATCCGTAATTCATATTGTAAGTTTT GCTATAAGAGCTGCACTTATGTTCGGAGGAATTAAGGGCGGACAGTTAAATGATATATTGAAATATA CAGCAGAAAGAGTACCTGCTTTTGTAAATGCATTTGGACCATTAAGCGAACTTGTAGTTTCAGCAGG TGCAGGAGCTATAGCACTTGGATTCCCTGTAATAACTGATCAGGTTGTACCAGAAGTTCCTACATTG TTGTTAACTCAAAAAGATTACGATAAAGTTGTTAAAACTTCATTAGAAGCTAGGAATATAAAGATAA AGATAACTGAGATCCCAATTCCAGTTGCTTTTGCAGCAGCATTTGAAGGTGAAAGAATAAGAAAGAA TGATATGCTTGCAGAGTTTGGTGGAAATAAGACTAAAGCTTGGGAATTAGTTATGTGTGCAGATCAG GGAGAAGTTGAAGATCACAAGATAGAAGTTATAGGACCAGATATAGATACTATAGATAAGGCTCCTG GAAGAATGCCTCTTGGAATGCTTATTAAAGTAAGTGGAACAAATATGCAGAAGGATTTTGAGCCAGT GCTTGAAAGAAGACTTCACTACTTCTTAAACTATATAGAAGGAGTAATGCATGTTGGTCAGAGAAAT CTTACTTGGGTAAGAATAGGTAAGGAAGCTTTTGAAAAAGGATTTAGATTGAAACATTTTGGTGAAG TAATATATGCTAAAATGTTAGATGAATTTGGTTCAGTTGTAGATAAATGTGAAGTAACTATAATAAC TGATCCAGATAAGGCTGAAGAATTGGAAGGCAAATATGCTGTACCTAGATATTCAGAAAGAGATGCA AGACTTGAATCATTAGTTGATGAAAAAGTTGATACTTTCTATTCATGTAATTTGTGTCAATCATTTG CACCTGCACATGTATGTATAGTAACTCCTGAAAGACTTGGACTTTGCGGTGCAGTTTCATGGCTTGA TGCTAAAGCTACACTTGAATTGAATCCAACAGGACCATGTCAGGCAGTTCCAAAAGAAGGCGTGGTT GATGAAAATTTAGGTATTTGGGAAAAAGTAAATGAAACTGTTTCAAAAATTTCTCAAGGCGCTGTAA AGAGTGTTACATTATACAGTATATTACAAGATCCAATGACTTCCTGTGGATGTTTTGAGTGTATTAC AGGTATAATGCCAGAAGCAAATGGTGTTGTAATGGTAAACAGGGAATTTGGAGCAACAACTCCTCTT GGAATGACATTTGGTGAACTTGCATCTATGACAGGTGGTGGAGTTCAGACTCCAGGATTTATGGGAC ATGGAAGACAATTCATAGCTTCAAAGAAGTTTATGAAAGGTGAAGGTGGACTTGGTAGAATAGTTTG GATGCCAAAAGAATTAAAAGACTTTGTTGCAGAAAAATTAAATAAGACAGCAAAGGAATTATATAAT ATAGATAATTTTGCAGATATGATCTGTGATGAAACTATAGCTACAGAATCTGAAGAAGTATTAAAAT TCTTGGAAGAAAAAGGCCATCCTGCATTAAAGATGGATCCAATAATGTAG >Gene ID No. 18: RCCC00874 Contig0001_3075295_3076956 AATTGTCACAAATAAAAGAGAAATATGGACCTGATTCTATAATGGGAACAGGATGTGCTAGGGGTTC TGGAAATGAAGCAAACTACGTAATGCAAAAGTTTATGAGGGCGGTTATTGGAACCAATAACGTAGAT CACTGTGCCAGAGTTTGACATGCTCCTTCTGTAGCCGGTCTGGCTTACGTTTTAGGAAATGGTGCTA TGTCAAATGGTATACATGAAATAGATGATACAGATTTACTACTTATTTTTGGATATAATGGAGCAGC TTCGCATCCAATAGTTGCTAAGAGAATAGTTAGGGCAAAACAAAAAGGTGCAAAGGTAATAGTTGTA GATCCACGTATAACAGAGTCTGGTAGGATAGCAGATTTATGGCTCCCTATAAAAAATGGAACAAATA TGGTTCTTGTAAATACTTTTGCCAATATACTTATAAACAAGCAATTTTATGACAAACAATATGTAGA AGATCATACTGTTGGTTTTGAAGAATATAAATCTATAGTTGAGGATTATACGCCTGAATATGCAGAA AAAGTTACTGGTATACCTGCAGAGGATATAGTAGAAGCTATGAAAATGTACTCCAGTGCTAAAAATG CTATGATATTGTACGGTATGGGAGTATGTCAGTTTGCTCAAGCTGTAGATGTAGTAAAAGGGTTAGC TTCAATAGCTTTATTAACTGGTAATTTTGGAAGACCTAATGTAGGCATAGGACCTGTAAGAGGCCAG AACAATGTGCAAGGTGCCTGCGATATGGGAGCACTTCCTAATGTATACCCAGGTTATCAAAGTGTAA CTGACGATGCAATTAGAGAAAAATTTGAAAAAGCTTGGGGAGTTAAACTTTCAAACAAAGTTGGTTA TCACCTGACACGAGTTCCTGAATTAACGCTTAAAGAGGATAAAATAAAAGCATATTATATAATGGGC GAAGATCCAGCTCAAAGTGATCCTGATTCTAATGAAATGAGGGAAACACTTGATAAAATGGAACTTG TAATAGTTCAAGATATATTTATGAATAAAACTGCACTCCATGCAGATGTAATTTTACCTTCTACGTC TTGGGGAGAACATGAAGGAGTCTTCAGTTCTGCTGATAGAGGATTCCAGAGATTTAGAAAAGCTGTA GAACCTAAGGGCGATGTTAAACCAGATTGGGAGATAATTTCAGAAATTGCATGTGCTATGGGTTATG ATATGCATTATAACAATACTGAGGAAATATGGGATGAACTTATAAATTTATGCCCAAATTTCAAAGG AGCAACTTATAAGAGATTGGATGAATTAGGAGGAATTCAATGGCCTTGTCCATCTGAAGATCATCCA GGAACTTCTTATCTCTACAAAGGAAATAAATTTAATACACCTACTGGAAAAGCAAATTTATTTGCAG CAGAATGGAGACCTCCTATAGAGAAGACAGATGAAGAATATCCACTTGTTCTTTCTACAGTTAGAGA AGTAGGGCATTACTCCGTAAGAACAATGACAGGAAACTGTAGGGCACTCCAGCAGTTAGCTGATGAA CCAGGATATGTACAAATTAATCCAGTGGATGCAAAGGCTAAAAAAATAATAGATGGTGAGCTTATGA GAGTAAGTTCACGAAGAGGTTCTGTAGTTGCCCGTGCACTTGTTACTGAAAGGGCAAATAAAGGAGC AGTTTATATGACCTATCAATGGTGGGTAGGTGCATGTAATGAGCTTACAGCTAATAATTTAGATCCA GTATCAAAAACTCCTGAATTAAAGTATTGTGCAGTGAAGGTAGAAGCTATAGAAGATCAGAAAGAAG CTGAAAAGTTTATAAAAGATCAATATGCTTCAATAAAGAAAAAGATGAATGTTTAA >Gene ID No. 19: RCCC03324 Contig0001_1234499_1232313 TATTTTGCAAAGGAGTTCATATTCATATAGGTAAACTATGCCTATTATGAGTATGAACTTTTTATAT TATCAAAATATTTTTAATTTTTATTTTATACAAAAAATATATAAGTATATTATTACTCAAGTTATTT TTAAAGATACATAGAAATTTGAGTGATAATGATTTTTAGTTTCTACCGAGCCCTGAAATAAAAGGGG TGAGAGTTATGATTACGCCTATTTATAAAAAAGAAGGAGTGGAATTATTAATGGAAAAAAAGGTATT AACTGTATGTCCTTATTGCGGTGCTGGATGTCAACTGTATCTAATTGTTAAAGATGGACAAATAGTA AGAGCAGAACCTGCTAATGGAAGAACAAATGAAGGAACTCTTTGTCTTAAAGGACGCTATGGTTGGG ATTATCTAAATGATCCTCAACTTCTAACTCCACGTATAAAAAAACCTATGTTAAGAAAAAATGGTAA ATTAGTAGAAGTAACTTGGGATGAAGCTATTAAGTTTACGTCAGAAAAATTAACAGAAATAAAAAAT AAGTATGGTGCTGATTCTATAATGACTACAGGCTGTTCTAGAGGTCCTGGAAATGAGACAAATTATA TAATGCAAAAATTTGCACGTGCTGTAATAGGTACAAACAATGTAGATAACTGTGCTAGAGTTTGTCA TGGTCCCTCAGTAGCAGGATTAGCTACAGTACTTGGAAATGGTGCCATGTCAAATACTATTCCTGAA ATTGAAAATGCAGATTTGCTTCTTATATTTGGATACAATCCAGCAGAATCTCATCCTATAGTTGCTA GAAGAGTAGTTAAAGCAAAGGAAAAAGGAGCAAAAATTATAGTTGTAGATCCTAGGGTCACAGAAAG TGTGAGAATATCTGATCTTTGGCTTCAATTAAAAGGTGGTACAAATATGGCACTTGTAAATGCATTT GCCAATGTACTACTTAATGAAAATTTGTATAACAAAGAATATGTTGCTAATTATACTGAAAACTTTG AAGAATATAAATCAATTATACAAAAATATAATCCAGAATATGCAGGGAAAATAACAAATGTCCCTGC TGAAGACATAAAAAAAGCCATGAGAATGTATGCTAACGCAAAAAATCCAATGATTCTTTATGGTATG GGGGTATGTCAATTTGGTCAAGCTGTAGATGTAGTTAAAGGTTTAGCTGGCTTAGCGTTAATGACAG GAAACTATGGCAGGCCTAGCGTTGGTATAGGTCCTGTAAGAGGACAAAATAATGTTCAGGGCGCTTG TGATATGGGTGCTATTCCTAATTGTTACCCTGGATATCAAAAGGTTACGGATAAAAATGTTAGAGAA AAATTTGAAAAGGCTTGGGGAGTAAAGCTTCCTGATAAAGTGGGATATCATTTAACAGAAGTGCCTG AGTTAGTTTTAAAAGAAAATAAACTGAAAGCTTATTATATAATGGGCGAGGATTGTGTTCAAAGTGA CCCAAATGCAAACGATGTAAGAAAAGCTTTAGATAAATTGGAACTTGTAATAGTTCAAGATATATTT ATGAATAAAACAACTTTACATGCTGATGTAATACTTCCGGCTACTGCTTGGGGAGAACATGAAGGTG TATACAGTTCTGCTGATAGAGGTTTTCAAATATTCCGAAAAGCTGTTGAACCAAAGGGAGATGTTAA ACCAGATTGGCAGATAATTTGTGAGTTAGCTACTGCCATGGGATATCCTATGCATTATAATAATACA AAAGAAATATGGGATGAAATGAGAAGTCTTTCTCCAAAATTTGCTGGTGCTAGCTATGAAAGAATGG AAAAGTTAGGAGGAATAATTTGGCCTTGTCCTTCTGAAGATCATCCTGGAACTCCTGTGCTTTATGA AGGAAACATTTTTAGTACACCAAGTAAAAAAGGTATTTTATTTGCTGCAGAATGGAGACCTACACAA GAATCTCCAGATAAAGAATATCCATTAAGTTTATGTACAGTTAGAGAAATAGGTCACTACTCTGTAA GAACAATGACTGGTAATTGCCGTGCTCTCAAGGCACTTGAAGATGAACCAGGTAAAATTCAAATGAG TTTGGAAGATGCTGAAGAACTTGCTATAAATGATGGAGATCTAGTACGAGTAAGTTCAAGAAGAGGT TCTGTAATGTCAAGAGCCTTAGTTACAGATAGAGTTCGTAAGGGTAATACTTATATGACTTATCAAT GGTGGATTGGAGCTTGTAATGACCTTACTGTTGATAACTTAGATCCTGTATCAAAAACACCTGAATA TAAATATTGTGCAGTTAAAGTGGAGGCAATAAAGGATCAAGATAAAGCTGAAAAATGTTTATTAGAA ACATACAATGAATTACGTAAAAAAATGGGAGTAAAAAATATGTAG >Gene ID No. 20: RCCC01717 Contig0001_3590430_3591623 TATAAACTTGTTCAAAGATTTGCAAAAGCTGATGCTATAGGACCTGTATGCCAGGGATTTGCAAAAC CTATAAATGATTTGTCAAGAGGATGTAACTCCGATGATATAGTAAATGTAGTAGCTGTAACAGCAGT TCAGGCACAAGCTCAAAAGTAATAACAAAAAGCATAAATGATTCATTTTTAGGAGGAATATTAAACA TGAAAATATTAGTAGTAAACTGTGGAAGTTCATCTTTAAAATATCAACTTATTGATATGAAAGATGA AAGCGTTGTGGCAAAAGGACTTGTAGAAAGAATAGGAGCAGAAGGTTCAGTTTTAACACATAAAGTT AACGGAGAAAAGTTTGTTACAGAGCAGCCAATGGAAGATCATAAAGTTGCTATACAATTAGTATTAA ATGCTCTTGTAGATAAAAAACATGGTGTAATAAAAGATATGTCAGAAATATCTGCTGTAGGGCATAG AGTTTTGCATGGTGGAAAAAAATATGCGGCATCCATTCTTATTGATGACAATGTAATGAAAGCAATA GAAGAATGTATTCCATTAGGACCATTACATAATCCAGCTAATATAATGGGAATAGATGCTTGTAAAA AACTAATGCCAAATACTCCAATGGTAGCAGTATTTGATACAGCATTTCATCAGACAATGCCAGATTA TGCTTATACTTATGCAATACCTTATGATATATCTGAAAAGTATGATATCAGAAAATATGGTTTTCAT GGAACTTCTCATAGATTCGTTTCAATTGAAGCAGCCAAGTTGTTAAAGAAAGATCCAAAAGATCTTA AGCTAATAACTTGTCATTTAGGAAATGGAGCTAGTATATGTGCAGTAAACCAGGGAAAAGCAGTAGA TACAACTATGGGACTTACTCCCCTTGCAGGACTTGTAATGGGAACTAGATGTGGTGATATAGATCCA GCTATAATACCATTTGTAATGAAAAGAACAGGTATGTCTGTAGATGAAATGGATACTTTAATGAACA AAAAGTCAGGAATACTTGGAGTATCAGGAGTAAGCAGCGATTTTAGAGATGTAGAAGAAGCTGCAAA TTCAGGAAATGATAGAGCAAAACTTGCATTAAATATGTATTATCACAAAGTTAAATCTTTCATAGGA GCTTATGTTGCAGTTTTAAATGGAGCAGATGCTATAATATTTACAGCAGGACTGGAGAAAATTCAGC TACTAGCAGATCTGCTATATGTAAGGGATTAAGCTATTTTGGAATTAAAATAGATGAAGAAAAGAAT AAGAAAAGGGGAGAAGCACTAGAAATAAGCACACCTGATTCAAAGATAAAAGTATTAGTAATTCCTA CAAATGAAGAACTTATGATAGCTAGGGATACAAAAGAAATAGTTGAAAATAAATAA >Gene ID No. 21: RCCC01718 Contig0001_3589384_3590382 GATTAAATTTTTACTTATTTGATTTACATTGTATAATATTGAGTAAAGTATTGACTAGTAAAATTTT GTGATACTTTAATCTGTGAAATTTCTTAGCAAAAGTTATATTTTTGAATAATTTTTATTGAAAAATA CAACTAAAAAGGATTATAGTATAAGTGTGTGTAATTTTGTGTTAAATTTAAAGGGAGGAAATAAACA TGAAATTGATGGAAAAAATTTGGAATAAGGCAAAGGAAGACAAAAAAAAGATTGTCTTAGCTGAAGG AGAAGAAGAAAGAACTCTTCAAGCTTGTGAAAAAATAATTAAAGAAGGTATTGCAAATTTAATCCTT GTAGGGAATGAAAAGGTAATAGAGGAGAAGGCATCAAAATTAGGCGTAAGTTTAAATGGAGCAGAAA TAGTAGATCCAGAAACCTCGGATAAACTAAAAAAATATGCAGATGCTTTTTATGAATTGAGAAAGAA GAAGGGAATAACACCAGAAAAAGCGGATAAAATAGTAAGAGATCCAATATATTTTGCTACGATGATG GTTAAGCTTGGAGATGCAGATGGATTGGTTTCAGGTGCAGTGCATACTACAGGTGATCTTTTGAGAC CAGGACTTCAAATAGTAAAGACAGCTCCAGGTACATCAGTAGTTTCCAGCACATTTATAATGGAAGT ACCAAATTGTGAATATGGTGACAATGGTGTACTTCTATTTGCTGATTGTGCTGTAAATCCATGCCCA GATAGTGATCAATTGGCTTCAATTGCAATAAGTACAGCAGAAACTGCAAAGAACTTATGTGGAATGG ATCCAAAAGTAGCAATGCTTTCATTTTCTACTAAGGGAAGTGCAAAACACGAATTAGTAGATAAAGT TAGAAATGCTGTAGAAATTGCCAAAAAAGCTAAACCAGATTTAAGTTTGGACGGAGAATTACAATTA GATGCCTCTATCGTAGAAAAGGTTGCAAGTTTAAAGGCTCCTGAAAGTGAAGTAGCAGGAAAAGCAA ATGTACTTGTATTTCCAGATCTCCAAGCAGGAAATATAGGTTATAAACTTGTTCAAAGATTTGCAAA AGCTGATGCTATAGGACCTGTATGCCAGGGATTTGCAAAACCTATAAATGATTTGTCAAGAGGATGT AACTCCGATGATATAGTAAATGTAGTAGCTGTAACAGCAGTTCAGGCACAAGCTCAAAAGTAA >Gene ID No. 22: RCCC00020 Contig0001_19768_21588 GGAGAACTGTATTGCTTATTATTTAAGCATTTTATTATAAAATAAAAAAACGTTATTAAATTATTTA CTATGAATTCACTTGATAATCAACACATTGCATGTAATGTTGATTATTGAGTGTTTTTTTGTAACCA TATTTGGCACAATTTATGCTCTATAACATTTCTGAAATAAATATATGTATATGAGGAGGAATTTCAA TGTATGGTTATAATGGTAAAGTATTAAGAATTAATTTAAAAGAAAGAACTTGCAAATCAGAAAATTT AGATTTAGATAAAGCTAAAAAGTTTATAGGCTGTAGGGGACTAGGTGTTAAAACTTTATTTGATGAA ATAGATCCTAAAATAGATGCATTATCACCAGAAAATAAATTTATAATTGTAACAGGTCCGTTAACTG GAGCTCCAGTTCCAACTAGTGGAAGGTTTATGGTAGTTACTAAAGCACCGCTTACAGGAACTATAGG AATTTCAAATTCGGGTGGAAAATGGGGAGTAGACTTGAAAAAAGCTGGCTGGGATATGATAATAGTA GAGGATAAGGCTGATTCACCAGTTTACATTGAAATAGTAGATGATAAAGTAGAAATTAAAGATGCGT CACAGCTTTGGGGAAAAGTTACATCAGAAACTACAAAAGAGTTAGAAAAGATAACTGAGAATAGATC AAAGGTATTATGTATAGGACCTGCTGGTGAAAGATTGTCCCTTATGGCAGCAGTTATGAATGATGTA GATAGAACTGCAGCAAGAGGCGGCGTTGGTGCAGTTATGGGATCTAAAAACTTAAAAGCTATTACAG TTAAAGGAACTGGAAAAATAGCTTTAGCTGATAAAGAAAAAGTAAAAAAAGTGTCCGTAGAAAAAAT TACAACATTAAAAAATGATCCAGTAGCTGGTCAGGGAATGCCAACTTATGGTACAGCTATACTGGTT AATATAATAAATGAAAATGGAGTTCATCCTGTAAATAATTTTCAAGAATCTTATACGGATCAAGCAG ATAAAATAAGTGGAGAGACTCTTACTGCTAACCAACTAGTAAGGAAAAATCCTTGTTACAGCTGTCC TATAGGTTGTGGAAGATGGGTTAGACTAAAAGATGGTACAGAGTGCGGAGGACCGGAGTATGAAACA CTGTGGTGTTTTGGCTCTGACTGTGGTTCATATGATTTAGATGCTATAAATGAAGCTAATATGTTAT GTAATGAATATGGTATTGATACTATTACCTGTGGTGCAACAATTGCTGCAGCTATGGAACTTTATCA AAGAGGATATGTAAAAGATGAAGAAATAGCCGGAGATAACCTATCTCTCAAGTGGGGAGATACGGAG TCTATGATTGGCTGGATAAAGAAAATGGTATATAGTGAAGGCTTTGGAGCAAAGATGACAAATGGTT CATATAGGCTTTGTGAAGGTTATGGAGTACCTGAGTATTCTATGACAGTTAAAAAACAAGAAATTCC AGCATATGATCCAAGGGGAATACAGGGACATGGTATTACCTATGCAGTTAATAATAGAGGAGGATGT CATATTAAGGGATATATGATTAATCCTGAAATATTAGGTTATCCGGAAAAACTTGATAGATTTGCAT TAGATGGTAAAGCAGCCTATGCCAAAATGATGCATGATTTAACTGCTGTAATTGATTCTTTAGGATT GTGCATATTCACTACATTTGGGCTTGGAATACAGGATTATGTAGATATGTATAATGCAGTAGTAGGA GAATCTACTTGTGATTCAGATTCACTATTAGAGGCAGGAGATAGAGTATGGACTCTTGAAAAATTAT TTAATCTTGCAGCTGGAATAGACAGCAGCCAGGATACTCTACCAAAGAGATTGTTAGAAGAACCTAT TCCAGATGGTCCATCAAAGGGACACGTTCATAGGCTAGATGTTCTTCTGCCAGAATATTACTCAGTA CGAGGATGGAGTAAAGAGGGTATACCTACAGAAGAAACATTAAAGAAATTAGGATTAGATGAATATA TAGGTAAGTTCTAG >Gene ID No. 23: RCCC01356 Contig0001_3966524_3969232 TAAAGAGCAATTATGAATAATAATAACATAGAAACAAACAATAAAAGTGAGAATCTTGTTTATCCGA TGACTACTCGCTCTAATACTCCCACTTCTGCAAGTGGGAGTAAAGAGCGACTACGTCCCTGGATAAC GATTTTTCCTAAAGGATAACGTCTTCTAAGTGCTGAAGCACTAAGAATACTGTTAATAAGCATCAGG TGGAGTTAAAACTCCATCTGATGCCAAGAAATCTGTTTATATTTAACAGCATGAAAAATAAGAAAGA GGTGTCATTAATGAAGGTAACTAAGGTAACTAACGTTGAAGAATTAATGAAAAAGTTAGATGAAGTA ACGGCTGCTCAAAAAAAATTCTCTAGTTATAGTCAGGAACAAGTGGATGAGATCTTTAGGCAGGCAG CTATGGCAGCCAATAGTGCTAGAATAGATCTAGCTAAAATGGCAGTGGAAGAAAGCGGAATGGGAAT TGTAGAAGACAAGGTTATTAAAAATCATTTTGTTTCAGAATATATATATAACAAATATAAGGATGAA AAGACCTGTGGAGTTTTAGAAGAAGACCAAGGTTTTGGTATGGTTAGAATTGCGGAACCTGTAGGGG TTATAGCAGCAGTAGTTCCAACAACTAATCCAACATCCACAGCAATCTTTAAATCTTTAATAGCTTT GAAAACTAGAAATGGTATAGTTTTTTCACCACATCCAAGAGCAAAAAAATCAACTATTGCAGCAGCT AAGATAGTACTTGATGCAGCAGTTAAAGCTGGTGCTCCTGAAGGAATTATAGGATGGATAGATGAAC CTTCCATTGAACTCTCACAGGTGGTAATGAAAGAAGCAGATTTAATTCTTGCAACTGGTGGCCCGGG TATGGTTAAGGCTGCCTATTCTTCAGGAAAGCCTGCTATAGGAGTTGGCCCAGGTAACACACCTGCT GTAATTGATGAAAGTGCTGATATTAAAATGGCAGTAAATTCAATACTCCTTTCAAAAACTTTTGATA ATGGTATGATTTGTGCTTCAGAGCAGTCAGTAGTAGTTGTAAGCTCAATATACGATGAAGTCAAGAA AGAATTTGCAGATAGAGGAGCGTATATATTAAGTAAGGATGAAACAGATAAGGTTGGAAAAACAATT ATGATTAATGGCGCTCTAAATGCTGGCATTGTAGGGCAAAGTGCTTTTAAAATAGCACAGATGGCAG GAGTGAGTGTACCAGAGGATGCTAAAGTACTTATAGGAGAAGTTAAATCAGTAGAACCTGAAGAAGA GCCCTTTGCTCATGAAAAGCTGTCTCCAGTTTTAGCTATGTACAAAGCAAAAGATTTTGATGAAGCA CTTCTAAAGGCTGGAAGATTAGTTGAACGAGGTGGAATTGGGCATACATCTGTATTATATGTAAATT CAATGACGGAAAAAGTAAAAGTAGAAAAGTTCAGAGAAACTATGAAGACTGGTAGAACATTGATAAA TATGCCTTCAGCACAAGGTGCTATAGGAGATATATATAACTTTAAACTAGCTCCTTCTTTGACGCTA GGATGTGGTTCCTGGGGAGGAAACTCTGTATCAGAAAATGTTGGACCTAAACATTTATTAAACATAA AAAGTGTTGCTGAGAGGAGAGAAAATATGCTTTGGTTTAGAGTACCTGAAAAAGTTTATTTCAAATA TGGTAGTCTTGGAGTTGCATTAAAGGAATTGAGAACTTTGGAGAAGAAAAAGGCATTTATAGTAACG GATAAGGTTCTTTATCAATTAGGTTATGTAGATAAAATTACAAAAAATCTCGATGAATTAAGAGTTT CATATAAAATATTTACAGATGTAGAACCAGATCCAACCCTTGCTACAGCTAAAAAAGGTGCATCAGA ACTGCTTTCCTATGAACCAGATACAATTATAGCAGTTGGTGGTGGTTCGGCAATGGATGCAGCCAAG ATCATGTGGGTAATGTATGAGCATCCAGAAGTAAGATTTGAAGATTTGGCTATGAGATTTATGGATA TAAGAAAGAGAGTATATGTTTTTCCTAAGATGGGTGAAAAAGCAATGATGATTTCAGTAGCAACATC CGCAGGAACAGGATCTGAAGTTACTCCATTTGCAGTAATTACGGATGAAAGAACAGGAGCTAAATAT CCACTGGCTGATTATGAATTGACTCCAAACATGGCTATAATTGATGCAGAACTTATGATGGGAATGC CAAAAGGGCTTACAGCAGCTTCGGGTATAGATGCATTAACCCATGCACTGGAGGCGTATGTATCAAT AATGGCTTCAGAATATACCAATGGATTGGCTCTTGAAGCAACAAGATTAGTATTTAAATATTTGCCA ATAGCTTATACAGAAGGTACAACTAATGTAAAGGCAAGAGAAAAAATGGCTCATGCTTCAACTATAG CAGGTATGGCTTTTGCCAATGCATTCTTAGGGGTATGTCACTCTATGGCACATAAATTGGGAGCACA GCACCATATACCACATGGAATTGCCAATGCGCTTATGATAGATGAAGTTATAAAATTCAATGCTGTA GAGGCTCCAAGGAAACAAGCGGCATTTCCACAATATAAGTACCCAAATGTTAAAAGAAGATATGCTA GAATAGCTGATTACTTAAATTTAGGAGGAAGCACAGATGATGAAAAAGTACAATTGCTAATAAATGC TATAGATGACTTAAAAACTAAGTTAAATATTCCAAAGACTATTAAAGAGGCAGGAGTTTCAGAAGAT AAATTCTATGCTACTTTAGACACAATGTCAGAACTGGCTTTTGATGATCAATGTACAGGAGCTAATC CAAGATATCCACTAATAGGAGAAATAAAACAAATGTATATAAATGCATTTGATACACCAAAGGCAAC TGTGGAGAAGAAAACAAAAAAGAAAAAATAA >Gene ID No. 24: RCCC03300 Contig0001_1213196_1212027 TGTAAAATAAAATCAGAAATTAGTTAATATATTTAAAATAAAATAAAAATTTATACAATGATGTATG AAAAAGCGATGAAGCTTCTAAAAGAATATTTATATTCTTAGGAAGCTTTTTTTATTTTATTGGTAGC TATCAAAAAATTACAAAATTTAATATGACTAATGTGAAGTTTCATAGATATTTTATTAAATTGGAGT ATGATTATTGTGAAAAATTTTAATGTTAAACCAAAGGTTTATTTTGGTACTGATGCTTTAAATCATT TGTGTGAATTAAAATGTAAGAAAGCTTTAATCGCTGCAGATCCATTTATGGTTAAGTCATCAACGGT TGATAAAATTACTGAACAGCTTGATAAGGCACATATAGAGTATGATATATTTTCAGATATAGTACCA GATCCTCCTGTTGAAGTTATTATAAAAGGAGTGCAGGAAGCTGTTAAATTTAAACCTGATGTACTTA TAGCACTTGGAGGAGGATCAGCTATTGATTCTGCAAAAGGAATAAGGTATTTTTGTCAGTATGTAAA TAATGAATTGAATAACGAAATGAAAGAGCCCCTGTTTATAGCAATTCCGACAACAAGTGGTACAGGC TCTGAGGTTACTAACTTTTGTATTGTAACTGATAAGCAAAAAGGAGTCAAATATGCTCTTGTTGATG ACAATTTGACGCCGGATCAGGCGGTACTTGATATTGAACTTGTAAAATCAGTGCCAAAAGCTACCAC ATCAGAAACAGGAATAGACGTACTTACACATGGAATTGAAGCATATGTTTCTACAAATAGATCAGAT TATTCTGATGCACTGGCAGAAAAATCAATAAAAATGGTATTTAAATACTTGTTAGCCGCATATGAAA ATGGAGATGATGAAGAAGCTAGAACGAAGATGCATAATGCATCCTGCATAGCAGGTATGGCATTTAC AAATGCTTCCCTTGGACTTAACCATGGCATGGCTCATGCACTTGGTGGAAAAATTCATATACCGCAT GGAAGAGCAAATGGACTACTTCTTCCATACGTAATAGAGTATAATGCAAACCTTAAAAACTTACAAG GAAAGATAAACCATTCTAGTGCAGCATATAGGTATACTGAAATATCAAAATTCTTGGGACTTCCAGC ATCTAACCAATTTGAAGGTGTTAGGAGTTTGATTGCAGCAGTTAAGATACTGATGAATAAACTTAAC TTACCTAAATGTATTAATAATTGTGAAGTTTTATGTGAAAATTTGGATAATGAGATTCATGAGTTAT CGATAACTGCCCTAAATGATAGATGTACAAAAACAAATCCGAGAATTCCTGAAATAAAGGATGTTGA AAATTTGTTTAAGAGGGTTTTTTCTAAAGAATAA >Gene ID No. 25: RCCC01567 Contig0001_3730455_3731297 CATAAAAGAAGAGCATGCAATTAGTTTTAAATTATTAGATAGTGTAAAGCGTTATAAACAATTTCTT GATACATACCCTGATTTGGAAGAACGTGTTAAGCAGTGTTATATTGCATCCTATTTAGGAATAACTC CTGTGTCTCTTAGCAGAATAAGAAGAAAATTAAATCTTAACAAATGATAATGCAATAAATCTCTAGG TGATTTATGATGTAGTTAATTTTTATTACTGGAGGTTAATTGTTATGAAAAATGAAATAGTTGTTTT AATTACTGGATGTTCTACAGGGATTGGAAGAGAGCTTTGTAGTATATTGTTTCACAAAGGATGTACG GTTGTTGCAACAGCAAGAAATGTAGAAACTTTAAAAGATTTATCTGCGTCCTTAAGATTACCACTGG ATGTTACCCAAAAAGAGTCTATTAACAGTACAATAAATGAAGTTGTATCAAAATTTCATAAAATTGA TATTCTTATAAATAACGCAGGCTATTCAATTAGAGGAGCTTTAGAAGAAATTGATTTAAATAGTGCT AAAAGTATGTTTGATGTAAATGTATTTGGTATTATTAACATGATTCAGGCAGTTATTCCAGAAATGC GTAAAAAACAATTTGGTAAGATTATAAATATTGGCTCCATTTCAGGGAAATTTGTTCAATCCATCAA TGGAGCGTATTGTGCATCAAAATTTGCAGTTGAGGCACTAAGTGACACACTTCGTTTAGAATTACAC AGCTACAATATTCAGAGCACCGTCATTGAGCCAGGTCCCATGAAAACCAACTTTTTTAAGGCATTAG TGGATAATTCAGGCGATGTTATAAAAAATGAAAATTCTTGTTATTCACATTTTTATAAATCAGATGA TGAATATAGAAAAAAGCAAAAACAAGCTGATCCTAAAGTAGCAGCACAAGCTATTAGTGATATAATT TTGAAAAAACGACTTAATGCTCGTTATAAAGTTGCTGTTCCATTTACATATAAGATGGTTACATATT TTCCTGATTTTCTAAGAGAATACTTTATGAAAAAAAGATAG >Gene ID No. 26: RCCC02765 Contig0001_686363_687232 TAGTTGATATATAACTTTTTAGTCGTACAAATACGAAATATATTTTATCATACTTGCATGTAAAATG CTATACAGCTTATACTTCTAAAGTTTGTTTATATTAGTTCACAGGGTTTCAAAAATTGTAGTTTATA ATCACATATATTTTCGAAATTCATATATTAAATAGAAGTACTTTACAATATTGGAGGAACTACTATA TGTGTTCAAATCATATTGGATGCAAATTTCCACGCTTTTTTCCACCCCAACATCAGCCACATCAACC TGGTATTGAATATATTATGACACCTAGACCAGTTTTCGAACCACCATTATGTGCACAATATCAAACG ACAAAAAGATTATTAAACAAAGTAGCTTTAATAACAGGAGGAGACAGCGGTATTGGGCGTGCTGTAG CATGTGCTTATGCAAAAGAAGGAGCTGATATTGCCATTGTCTATCTAAATGAACATGTAGATGCAGA GGGAACAAAATCTAGAATAAAAAAATTGGGGCGAAGATGTTTAACCATTCCAATTAACATAGGAGTC GAAGAGAATAGTAAAATTATAATTCAAGAAGTTATGAATCATTTTGGTAAATTAGATATTCTTGTAA ATAATGCTGCAGTACTTTATTACAATAATTCTATAGAAGAAGTATCTAGCAAACAATTAGAATGGAC TTTTCGTATAAATGTATTTTCTTATTTCTACTTAACTAAAGCAGCTCTACCTTATATGAAACCAGGC GGTTCTATCATCAATACTTCTTCAATAGTTGCTTTTAATCCTCCTTATGGGATATCTTTAGATTATG AAGCTTCAAAAGGTGCCATTGCTAATTTCACTATAAATTTAGCCCGAAGTTTGGTTTCAAGAGGAAT ACGTGTAAATGGTGTAGCTCCAGGTGAAACCTGGACACCTTTAATTCCAGCAGGATTACCTGCAGAT AAAGTTGCCGTTTGGGGTTCAAAAACACCAATGGGAAGAGCTGCTCAACCATTTGAAATTGCTCCAG CCTATGTATTCTTAGCTTCCAATGAATCAAGCTATATGTCAGGACAAACAATCCATATGTATTCTTA A >Gene ID No. 27: RCCC03290 Contig0001_1203895_1202426 GAGTAAAAGTTGATGAGGAGAGAAAATCAGGGTCACTTCTCGAAATAAAACAAAAACTTGAAAGAAT GAAAGTTATTGAACTCAGAAATATGGCTAGAAAAATGAATTTAAGTTCATTGACTAAGAAGGACATT AAATTTGGCAAGAAAAAGCAGCTGATTAAAGCAATTTTAGAGTACTATACAAGGAGGTTAAAGTAAA TGGAAAATATAGATAGGGATTTACAATCTATACAAGATGTAAGGCGGCTTGTTGAAAAGGCAAGACA AGCTCAACAAGAATATTGTAAATTCAGTCAGGAAAAGATGAATAAAATTATTGAGCATGTAGCGGAA TCTGCTGGCTTACAAGCTGAAAGATTAGCAAAACTTGCTGTAGAAGAAACAACTTTTGGAAATTTAC CTGATAAGATAATTAAAAATAAGTTTGCTAGTGAAATAGTGTATGAAAATATAAAGGACATGAAGTT AGTAGGTATTTTAAGAGATGACAAAGATAGAAAAGTATTAGAGATAGGTTCACCTGTAGGTATTATT GCAGGGCTTGTACCATCAACTAATCCTACTTCTACTGTTATATATAAAAGTCTTATAGCTTTAAAAT CGGGAAATGCAATTGTATTTAGTCCTCATCCAAAGGCAAGACATTGCATTGCAGAAGCTATAAAGGT TGTAAGTGATGCAGCTGTTGAGGCAGGAGCACCTTTAGGAATGGTTTCCGGAATGAGTATACTTACT ATGGAAGGAACTCATGAGCTTATGAAAAACGTTGATCTCATACTAGCAACAGGTGGATCAGCTATGG TAAAGGCAGCATACAGTTCAGGAACTCCGGCTATAGGAGTTGGACCTGGAAATGGACCTGCTTTTAT TGAAAAAACAGCAAATATAAAACTTGCAGTAAAAAGAATAATGGATAGTAAAACTTTTGACAATGGG GTAATATGTGCTTCAGAACAGTCCATAGTAGTTGAAAAATGTATAAAAGATGAAGTTGTAGATGAGC TTAAACGCCAAGGAGCATACTTCTTATCTAAAGAACAATCAGAAAAAGTAGCAAAGTTTATATTGAG AGCAAATGGTACTATGAATCCTCAAATTGTAGGAAAATCAGCTCAGAAAATAGCTGAAATGGCAGGT ATAACTGTAGATCCAAATGCAAGAATATTGATTTCAGAGCAGACGACAGTTGGAAAAGATAACCCAT TTTCAAGGGAAAAGCTTACAACGATTTTAGCATTCTACTGTGAAGAAAATTGGGAAAAAGCTTGCGA GAGATGCATTGAGCTTTTAAATAATGAAGGTATAGGACATACTCTCATAATACATTCAAATAATGAA GAAATAGTAAAAGAATTTGGACTTAAAAAACCTGTATCCAGAATACTTGTAAACACGCCAGGATCAC TTGGAGGAATAGGAGCTACTACAAATCTAGTGCCTGCACTTACACTTGGATGCGGAGCAGTTGGAGG AAGTGCAACTTCTGATAATGTAGGACCTAGGAATCTTATAAATATAAGAAGAGTTGCCTATGGAGTA AAGGAAATAGAAGATATAAAAAATTTTGTAAGTAATTGTAGTGACAGAGAAACCTCACACACTGTTT TGGATATTTCTGATCAGTCACATTGAACTTATAACTAAAAAAATAGCTGAAAAGCTTAGTTTGTAA >Gene ID No. 28: RCCC04101 Contig0001_2040462_2038897 ATGGTTTAGAAAAAGCTATTGAGATTTTAAGTAAGTTTAAGGTAATAGAGCTTCGAAATCTCGCTCG TAAATATAAGAACTTTGGTATCAAAGGAAGGTCCATTTCTAAAGCAGACAAGAAGTTGCTGCTTATA GAGTTCAAAAAATATTATGGGCATAATTAGCCAGCTATAAAAATTAAAATATATAAATAATAAACAA TGGAGGGAACACAATTGGAAAATTTTGATAAAGACTTACGCTCTATACAAGAAGCAAGAGATCTTGC ACGTTTAGGAAAAATTGCAGCATGTGAAATTGCTGATTATACTGAAGAACAAATTGATAAAATCCTA TGTAATATGGTTAGGGTAGCAGAGGAAAATGCAGTTTGCCTTGGTAAAATGGCTGCAGAAGAAACTG GTTTTGGAAAAGCTGAAGATAAGGCTTATAAGAACCATATGGCTGCTACTACAGTATATAATTATAT CAAGGATATGAAGACTATTGGTGTTATAAAAGAAGATAAAAGTCAAGGTGTAATTGAATTTGCTGAA CCAGTTGGTTTATTAATGGGTATTGTACCATCTACAAATCCAACATCTACTGTTATCTATAAATCAA TCATTGCAATTAAATCAAGAAATGCAATTGTATTCTCACCACACCCAGCTGCATTAAAATGTTCAAC AAAAGCAATAGAACTTATGCGTGATGCAGCAGTAGCAGCAGGAGCTCCTGCAAATGTAATTGGCGGT ATTGTTACACCATCTATACAAGCTACAAATGAACTTATGAAAGCTAAAGAAGTTGCTATGATAATTG CCACTGGAGGCCCTGGAATGGTAAAGGCTGCTTATAGTTCAGGAACACCTGCAATAGGCGTTGGTGC TGGTAACTCTCCATCTTATATAGAAAGAACTGCTGATGTTCATCAATCAGTTAAAGATATAATTGCT AGTAAGAGTTTTGACTATGGTACTATTTGTGCATCTGAGCAATCAATAATTGTTGAAGAATGCAACC ATGATGAAGTAATAGCTGAGTTGAAGAAACAAGGCGGATATTTCATGACAGCTGAAGAAACTGCAAA AGTTTGCAGTATACTTTTTAAGCCTGGTACACACAGTATGAGTGCTAAGTTTGTAGGAAGAGCTCCT CAGGTTATAGCAGCAGCTGCAGGTTTCTCAGTTCCAGAAGGAACAAAAGTTTTAGTAGGAGAACAAG GCGGAGTTGGTAATGGTTACCCTCTATCTTATGAGAAACTTACAACAGTACTTGCTTTCTATACAGT TAAAGATTGGCATGAAGCATGTGATCTTAGTATAAGATTACTTCAAAATGGTCTTGGACATACTATG AACATTCATACAAATGACAGAGACTTAGTAATGAAGTTTGCTAAAAAACCAGCATCCCGTATATTAG TTAATACTGGTGGAAGCCAAGGAGGTACTGGTGCAAGCACAGGATTAGCACCTGCATTTACATTAGG TTGTGGTACATGGGGAGGAAGCTCTGTTTCCGAAAATGTTACTCCATTACATTTAATCAATATAAAG AGAGTTGCATATGGTCTTAAAGATTGTTCTACATTAGCTGCAGATGATACAACTTTCAATCATCCTG AACTTTGTGGAAGCAAAAATGACTTAGGATGCTGTGCTACAAGCCCTGCAGAATTTGCAGCAAATAG CAATTGTGCTAGCACTGCTGCGGATACTACTGATAATGATAAACTTGCTAGACTCGTAAGTGAATTA GTAGCTGCAATGAAGGGAGCTAACTAA >Gene ID No. 29: RCCC04114 Contig0001_2051568_2050075 AAGCTGTAACAGATATGGGCGCTGAAGTTTATAGTTCAGTTGTTATTGCAAGTCCACATCCGGATCT TCAGAAAATCACCAAACGTTATACAATTGAAAATTTACTTCCTTAATATGTGGATGATATGATACCA CCACATAAAATGAAAAAGTACAGAAGTACAGTACTTAGTTAGTAAAAATGAAAGGGAGAGTTAGAAA TGAATATTATTGATAATGATTTGCTCTCCATCCAAGAATCCCGAATCCTTGTGGAAAATGCTGCACG AGCACAAAAAATGTTAGCAACTTTTCCGCAAGAAAAGTTAGATGAGATTGTTGAACGTATGGCTGAA GAAATCGGAAAACATACCCGAGAGCTTGCTGTAATGTCACAGGATGAAACTGGTTATGGAAAATGGC AGGATAAATGCATCAAAAACCGATTTGCCTGTGAATATTTGCCAGCTAAGCTTAGAGGAATGCGATG TGTAGGTATTATTAACGAAAATGGTCAGGATAAGACCATGGATGTAGGTGTACCTATGGGTGTAATT ATTGCATTATGTCCTGCAACTAGTCCGGTTTCTACTACCATATATAAGGCATTAATTGCAATTAAGT CTGGTAATGCAATTATCTTTTCTCCACATCCTAGAGCAAAGGAGACAATTTGTAAGGCGCTTGACAT CATGATTCGTGCAGCTGAAGGATATGGGCTGCCAGAAGGAGCTCTTGCATACTTACATACTGTGACG CCTAGTGGAACAATCGAATTGATGAACCATGAGGCGACTTCTTTGATTATGAATACAGGCGTTCCCG GGATGCTTAAAGCGTCATATAGATCTGGAAAACCTGTGATCTATGGAGGAACTGGTAATGGACCAGC ATTTATTGAACGTACAGCTGACATCAAGCAGGCGGTAAGAGATATTATTGCTAGTAAGACCTTTGAT AACGGAATAGTACCATCATCTGAACAATCTATTGTTGTAGATAGCTGTGTTGCATCTGATGTTAAAC GTGAGTTGCAAAATAGTGGTGCATATTTCATGACAGAGGAGGAAGCACAAAAACTGGGTTCTCTCTT TTTCCGTTCTGATGGTAGTATGGATTCAGAAATGGTTGGCAAATCCGCACAGAGATTGGCTAAGAAA GCAGGTTTCAGTATTCCTGAAAGTAGCACAGTGCTAATTTCAGAGCAGAAATATGTTTCCCAAGATA ATCCTTATTCCAAGGAGAAACTTTGTCCGGTACTAGCTTACTACATTGAAGATGATTGGATGCATGC ATGTGAAAAGTGTATTGAGCTGCTATTAAGTGAGAGACATGGTCACACTCTTGTTATACATTCAAAA GACGAAGATGTAATTCGCCAGTTTGCATTAAAAAAACCTGTAGGCAGGATACTTGTTAATACGCCTG CTTCCTTTGGTAGTATGGGTGCTACAAGTAATTTATTTCCTGCTTTAACTTTAGGTAGTGGATCGGC AGGTAAAGGTATTACCTCCGATAATGTTTCACCAATGAATCTTATTTACGTCCGTAAAGTCGGATAT GGCGTACGGAATGTAGAAGAGATTATTAATACTAATGGATTGTTTACAGAAGAAAAAAGTGATTTGA GTGGTATGACAAAGCAGTCAGACTATAATCCAGAGGATATACAAATGTTGCAGCATATTTTGAAAAA AGCTATGGAAAAAATTAAATAG >Gene ID No. 30: RCCC00038 Contig0001_43778_45121 AAATGAATATTTATTGCTGCAGTACTATATTCCACTGGTTGAATAGTGTACTTAAATGCTCCTTTAG GTTTAGCAAAAATTTGTGATTATTATCCTTTAGATAAGGAAAGTATATTAGTTATTAGAAGCTATTG AATTAGAGAAAATTAATTGTAATGAGCAAGTTTTTGATGAACGGTTAAGAGGAGATGTAGTGTAAAT TGAGAGATGATTATAGGAATCTATTTAAATTCATAATAAAGGCATATTATAGTGGAAACTTTGAAGA AGAAGTGATGTCATTTTTATTAGAGTCTAAAATGGATAAACAGGAATTGTGTAAGATTATATCTACA TTGTGCGGTACTAATGTAGATTACAGCTCTAACTTTATAGAAAATTTAAAAAAAGCAATAAAGTCTT ATAAACAAGATGGTAAAGTAGTCAATAAAGTTAAAGACTGTTCCATGGAATGTGTGGATGAAAAAGG TGAGATACTATGTCAAAAAACATGTCCTTTTGATGCAATTTTTATAGACAATAAGAAAAATTGTGCT TACATAGATAAAGAAAAGTGTACCGATTGTGGTTTGTGTGTAGATGTTTGCCCTACTGGGGGAATAA TGGATAAAGTTCAGTTCATTCCTATTTTGGATATTTTAAAAAGTAAATCTCCAGTTGTGGCTATAGT GGCTCCTGCCATAATAGGACAGTTTGGGGAAGATGTTACTATGGATCAACTTAGGACCGCTTTTAAA AAACTGGGATTTACTGATATGATTGAAGTGGCATTTTTTGCAGATATGCTTACTTTAAAGGAATCTA TTGAATTTGACAATCATGTAAAAGATGAAAAAGATTTTATGATAACTTCCTGCTGTTGTCCTATGTG GGTGGCTATGGTAAAAAAGGTATACAGTAACTTGGTTAAACATGTATCTCCCTCTGTATCTCCGATG GTTGCAGGAGGAAGAGTACTTAAAAAGTTAAGTCCTTACTGCAAGGTAGTGTTTATAGGCCCATGTA TTGCTAAAAAATCTGAGGCAAAGGAAGAAGATATAAAAGGAGCAATAGATTTTGTACTTACTTTTGA AGAATTAAGAGATATATTTGATGCTTTTCATATAGTTCCATCTAAACTTGAAGGAGATTTTTCATCT AAATATGCTTCTAGAGGTGGAAGATTATATGCCCGTACAGGTGGAGTTTCTATTGCAGTAAGCGAAG CTGTGGAAAAGATTTTTCCTGAAAAGCATAAACTATTTAGTGCAATTCAGGCAAATGGCATTAGAGA ATGTAAAGAAATGCTTACCAAGGTGCAAAATGGAGAAATAAAAGCTAATTTTATTGAAGGAATGGGC TGTATTGGTGGATGTGTAGGTGGTCCCAAAGCAATTGCATCTAAGGATGAAGGTAGGGATCGAGTAA ATAAATTTGCACAAGATTCTGAAATAAAAGTTGCTGTAGATAGTGAATGTATGCATGGAGTATTACA TGCTTTGGATATACATTCTATAGATGATTTTAAGGATGAGAAAAAAATAGAACTGTTAGAACGAGAA TTTTAA >Gene ID No. 31: RCCC00878 Contig0001_3079817_3080311 ATAATTAGTTCTTAATTAAATAGGACTAAATTTATATTTTAATTTTTAAATAAGGTAATTAAAATAA TTTTAAATTAAATATGTTATATGTTTTAAAATTATTTCTTAAGCATAGAGGCTCAAATCTTTGATTT AGAGCTAATATCTTATTCCTTCTAATATTTTAAGGGGGAAATCAATTATAATATTCAAATGGGAGGG TGAAGTATTTAATGTTAACTAAACAGCAAAATGAAGACCTGTCTGGACAAGATGTAATTGAAAAATA TCCTAAAGAGCAGAGATTTACTCTTGCTATACTACAGGATATACAGAGAAAGTACAAATATATACCC AGAGAAGCACTGGAGAATTTAGCTAAGTATTTGGACACGCCTGTAAGTAGACTGTATGGTATGGCTA CTTTTTATAAGGCATTGAGCCTTACTCCAAAAGGGGAAAACATAATAACTGTATGTGATGGAACCGC TTGCCATGTTGCTGGTTCTATGGTTGTAATGGATGAACTTGAAAAGGCAATAGGAATTAAACCAGGT GAAACTACAGAAGATCTTAAATTTTCAATAAATACAGTTAACTGTATAGGATGCTGTGCAATAGCTC CTGTCATGATGATAAATGACAAATATTTTGGAAATTTAACACCTAAACTGGTTGAAGAAATTCTTAG TGAGTATAGGAGTGAAAGCCATGAGTGA >Gene ID No. 32: RCCC00879 Contig0001_3080271_3082103 TTGAAGAAATTCTTAGTGAGTATAGGAGTGAAAGCCATGAGTGATAAAAAAATTGTCAATATATGTT GTGGAACAGGTTGCTTAGCTAAAGGCAGCAAGGAAGTATATGAAGAAATGAAGGCACAAATAGCTAA ATTAGGGGCAAATGCAGAAGTAAATGTTAAATTAAAAGCAACAGGTTGCGATGGATTGTGTGAGAAA GGTCCTGTACTGAAAATATATCCAGATGACATTGCATATTTTAAAGTTAAAGTAGAAGATGTAGAAG ACGTAGTAAAAAAGACATTGATGAATGGGGAAATAATTGAAAAATTATTATATTTTGAAACTGCTAC AAAACAGAGATTAAGAAATCATAAAGAAAGTGAATTTTGTAAAAGACAATACAAAATTGCTCTCAGA AATGTTGGTGAAATAGATCCAATAAGTTTGGAAGATTATGTTGAAAGAGGCGGATATAAAGCTCTTA AAAAAGCAATAAGCAGCATGAAACCTGAAGATGTGCTTGAAGAAATAACAAAATCAGGTCTTAGAGG AAGAGGTGGAGCAGGATTCCCAACAGGACGTAAATGGAAAACTGCTGCAGATATTGATACATCACCT ATATATGTAGTATGCAATGGTGATGAGGGAGATCCTGGAGCATTTATGGATAGAAGTATAATGGAGG GAGATCCTAACAGTGTTATAGAAGGTATGACATTGTGTGCCTATGCAGTAGGAGGTACAAACGGCTT TGCTTATATAAGAGATGAATATGGACTTGCTGTAGAAAATATGCAGAAAGCTATTAATAAAGCAAAA GATGAAAATTTATTAGGTAATAATATATTAGGAACTGACTTTTCCTTCGATATACAGATAGTAAGAG GTGGAGGAGCTTTTGTATGTGGTGAGTCTACTGCACTTATGTCATCTATAGAAGGTATGGTAGGAGA ACCTAGAGCTAAATATATACACACTACAGAAAAAGGATTGTGGGGACAACCTACTGTTTTAAATAAT GTAGAAACTTGGGCCAATGTACCTATAATAATTGAAAAAGGTGGAGATTGGTATCATGCTATAGGAA CTATGGAGAAGAGTAAGGGAACAAAAGTATTCTCATTAGTTGGAAAAGTTAAGAATACTGGACTTGT AGAAGTACCTATGGGAACTACTCTTAGAGAAATAATATATGATATTGGCGGTGGAGTATTAAACGAC AGAAAGTTTAAGGCAGTTCAAATAGGTGGACCTTCAGGAGGATGTTTACCATCTGAATATTTAGACT TGCCAGTAGATTATGATACTTTGGTTAAAGCGGATTCTATGATGGGTTCCGGCGGAATGATCGTAAT GGATGATAGAACCTGTATGGTAGATGTAACTAGATATTACTTGAGTTTCTTAGCTGAAGAATCTTGT GGAAAGTGTGTACCTTTGTAGAGAAGGCGTAAAGAGAATGCTTGAAATACTCACTGATATATGCAAT GGTGATGGAAAAGAAGGAGACATAGAAGAGCTTCTTGAAATATGTTCCATGACAAGCAAGGCATCTC TGTGCAGTCTTGGTAAGAGTGCTCCAAATCCAGTAAAAGCAGCTATAAGATATTTTAGAGATGAATT TGAAGAACATATAAAGAATAAGAGATGTAGAGCAGGAGTTTGTAAGAAACTTACTACATTTGGTATA GATCAAGATAAATGTAAGGGATGCGATATGTGTAAAAAGAATTGTCCAGCTGATTGTATAACAGGGG AAATTAAGAAACCACATACAATAGATGCTGATAAGTGCTTGAGATGCGGTAACTGCATGAACATCTG TAAGTTTGATGCTGTTAAGGTTTTATAG >Gene ID No. 33: RCCC00880 Contig0001_3082084_3082875 TTGATGCTGTTAAGGTTTTATAGGGAGGTGAATGTAGATATGAAAATTACAATAGATGGAAAAGCTT GTGAAGCTGAAAAAGGAGAATTCATATTACAAATAGCAAGAAGAAATAATATATATATACCTACACT GTGCCACAGTGATGCATTGCCTGGGCTTGCTAGCTGTAGACTGTGTATAGTTAAAGTAGTAGATAGG GGACGTGCAAAGATAGTAACTTCCTGTATATTCCCTGTAAGTAAGGAAGTAGAAGTTATAACTAATG ACGATGAAATAAAGAGAATGAGAAAAAACATAGTTATGCTTTTAAAAGTAAGATGCCCTGAAAATAA AGAAGTAAATGAATTAGCTAAAGCCTTTGGAGTAGAGGAAAAGAGAGTAAAGAGGTTCAAATTGGAT CCAGAACAAAATTGTGTTTTGTGCGGACTTTGTGCAAAAGCTTGCAAGGAATTAGGTACTGGAGCAA TCTCAACAGTTAATAGGGGTATGTATAAAGAAGTAGCAACTCCATATCACGAATCTTCACCAGAATG TATAGGATGTGCTTCCTGTGCAAATGTTTGTCCAACTAATGCAATAAAAGTTGTGGATAAAGATGGA GAAAGAGAAATATGGGGCAAAAAATTCAAGATGGTTAAATGTGATTTGTGCGGAGAATATTTTGCTA CAGAAGAACACGTAAAATATGCTTACAATAGGCTTGGAAAAGAGCAGCCAGAAAAGCTTATGTGCAG CAGCTGCAAGAAGAAAGTTACAGCCAAAGATGTCAAAAATATTTTTGAGAACGTGTGA >Gene ID No. 34: RCCC00881 Contig0001_3082905_3083456 ATGAAACCAGAGTTTAATTCTTTTGTAATAGCCGATCCTGACAAGTGCATAGGCTGTAGATCTTGTG AGATTGCCTGTGCTGCAAAACATAGAGAAGATACTCAAGGAAAAACTATTGGAACTATGAATAATAA AGTTACTCCAAGGTTATTCTTTGTTAAAAATAAAGGAAATGTAATGCCGGTACAATGCAGACATTGT GAGGATGCACCATGTCTAAATGCCTGCCCAGTTAATGCTATAGTTGAAAAAGATGGAAGTATCATTA TAAATGAAAGTGCATGTATAGGGTGTCAGACCTGTACAATAGTATGTCCGGTAGGTGCTGTAAGTTT ACTTCCTAGAACTCAAGGTAAAGTAGTTACAGGAGGAATTCAGGTTAAAGTAAGAGCAGCAGCTTAT AAATGTGATTTATGTAAGGAAGAGGGAGGAGAACCTGCCTGCGTCAAAGAATGTCCAAAAGAGGCCT TAAGGTTAGTAGATCCTAGAGAAGATAAAAAAGATCGTAGTGTGAAAGCTGCTATGGAACTGTTAAA TATAAACGCAAATCTCTAA >Gene ID No. 35: RCCC00882 Contig0001_3083493_3084479 ATGTTAAATATGCCAACTAGTACTTCTATGATAAATATAGATGAAGAATTATGTACAGGCTGCAGAC GATGTGCGGATGTCTGCCCTGTAGATGCTATAGAAGGTGAACAGGGTAAACCTCAGAAGATAAATAC TGAAAAGTGTGTTATGTGCGGACAATGCATTCAAGTTTGTAAAGGCTATCAATCTGTATACGATGAT ATTCCTACTCCAGTTAGCAAAAGGTTATTTGATAGAGGATTGTTAAAGGAAGTAGATGAACCATTAT TTGCAGCATATAATAAAGGTCAGGCAAAGAGAGTTAAAGAAATTTTACAAAACAAAGATGTATTTAA AATTGTGCAATGTGCACCTGCTGTAAGAGTTGCTATAGGAGAGGATTTTGGAATGCCTCTTGGAACT TTAAGTGAAGGAAAAATGGCAGCTGCACTCAGAAAATTAGGATTTGACAAAGTATATGATACAAACT TTGGTGCAGATCTTACTATAATGGAAGAAGGTAGTGAGTTACTAAAAAGAGTAGCTGAAGGTGGAGT TTTGCCAATGTTTACTTCTTGTTGTCCAGCATGGGTAAAATATGCAGAACAAACATATCCAGAACTT TTACCTCATCTTTCAAGTTGTAAGTCTCCAAATCAGATGGCTGGAGCTATATTTAAAACTTATGGAG CAGAGATAAATAAGGTTAATCCGGCTAAAATTTATAATGTATCTGTTATGCCATGTACATGCAAGGA ATTTGAAAGTGAAAGAGAAGAAATGCATGACAGTGGACACAGAGATGTAGATGCAGTTATAACTACA AGGGAATTAGCACAACTGTTCAAAGATGCTGATATAGATTTTAATACTATTGAAGAAGAACAGTTTG ATACTCCTCTTGGTATGTATACTGGTGCAGGAACTATATTTGGTGCTACAGGTGGAGTTATGGAAGC AGCACTTAGAACTGGATATGAACTTTATACTAAAAAACTATTCCAAGTATAG >Gene ID No. 36: RCCC00884 Contig0001_3084843_3085457 ATGAATTATTGCACACTAAATATATCTCAAGAAAAAAGGAGAGTTAATAAAATGAAGAATTGCCTCG TAGTAGCAGATCCTAATAAATGCATAGGATGTAGGACTTGTGAAGCAGCTTGTGGTATTGCACATTC AGGAGGGGACTTTTTTAATACAAATGTATCCAAAATTAATTTTAATCCTCGCTTAAATGTGATAAAA ACTGCTAAAGTAAGTGCTCCTGTTCAATGCAGACAATGCGAAGATGCACCTTGTGGTAAAGCTTGTC CAGTTAACGCTATTTCAAATGAAAATGGTTATGTTAGTGTAGATAAAGATGTATGTGTTGGATGTAA AATCTGCATGTTAGCTTGTCCTTTTGGAGCTATTGAATTAGCTTCTCAATATAAGGATGGAGAAGTT GTAGACCAAAAGGGACTTAAGATGAGTGAGGAAGGTAATCCTACTGTAAATGGAAAAGGAAGAGTGG TAGCAAATAAGTGTGATCTTTGCCAGGATAGGGATGGAGGACCTGCTTGCATAGAAGTTTGTCCTAC AAAATCTCTCAAATTAGTTACTTATGATGACAATAATAATATAGTTGAAAAAAAAGATGACGACGAA CGTGAAGTAGGCTAA >Gene ID No. 37: RCCC01502 Contig0001_3809248_3808769 CTATATGTATCCATAAAAATTTTCCTCCATTAGTCAATATATTGTCTAATTATAGTTTAATGATATT TTTTATATTTGTCAATACATTGTCTATTATTTTATCCGATGACTATATAATAAAAAACTCCCATACT ACCAATACTATCTTAAGAATATAAAATGAAAGATGGTGAAAAAACTGCGGCACAGCAGGAAATATTA TGGATGTATGCAAATTAGATAACGAAAAACTAAAAGAACTATCTTCCTATATAGATAGTTTGGAAGA AAAAGAAGGTTCACTTATAAGTGTACTTCACAGAGCTCAGGATATATTTGGATACCTTCCTGAAGAA TTACAAACATTTATTGCAAATAAACTTGACATTAGTGCAGCAAAAGTATTTGGCGTAGTTACTTTCT ATTCATACTTTACAATGAAGCCCAAAGGTAAACATGTAATAAGCATATGCATGGGTACAGCTTGTTT TGTTAAGGGTGCAGAAAACATTTTAGAAGAATTTAGGAATCAGCTTAAAGTAAAAGATGGATTTACC ACAGAAGACGGATTGTTCACTATAGATATTTTAAGATGTGTTGGAGCTTGCGGCCTTGCACCAGTAG TTGTAGTTGACGGAACAGTCCATGGAAAAGTAAAGGTCGAAGATGTTAAAGGAATATTAAGTCAATA TACCTTAAAATAA >Gene ID No. 38: RCCC01503 Contig0001_3808736_3806859 ATGGATAAGATAAAATCCTTTGAAGATTTAAAAGCTTTAAGAGAAAAGTATAAAGCTAAGATAGCAA ACCGTACTTATGATAATGCAGATAAAAATATAAAAAAAACTTTACTTGTATGCGGTGGAACAGGATG TCGTGCTTCAAGAAGCTTAGATATAGTCAATATACTTAAAACTGAAATTAAAAACGCAGGTCTAGAA AATACAGTTGATGTCATTTCTACAGGATGTTTTGGATTTTGTGAGAAAGGACCTATCGTCAAAGTTG TACCAGATAATATTTTTTATGTTGAAGTTAATACCGAGAGAGCAAAGCTAATTGTGTATGAACATAT GGCCAAAAATACAGTAGTTGAGGAAGCTTTATATAGAGATCCTATCACTAAAGAAAAAATATCAAAT CAAACGGATATTCCATTTTATAAAAATCAAAAAAGAATTGCTCTTAGAAACTGCGGCCTTTTAAACC CTGAAGATATTACAGAATACATAGCAATGAATGGGTACGAAGCTTTAGGCAGAGTTCTAACACAAAT GACACCTGACAGCACAATTGATGAAATTAAAAAAAGCGGCCTCAGAGGCAGAGGGGGCGGCGGCTTC CCTACAGGCGTAAAATGGGAAATGACAAGAAAATCCAAATCTGATACAAAGTTTATGATCTGTAATG CTGATGAAGGTGATCCCGGTGCCTTTATGGATAGAAGCATACTTGAGGGAGATCCAAATTCTGTACT TGAAGCTATGGCTATTGCAGGTTACTGCATAGGTGCAAATAAGGGTTATATTTATATCAGAGCTGAA TATCCTCTTGCAATAAACAGATTAAAAATTGCTTTAAAGCAAGCTTATGATTTAGGTTTACTGGGTG ATAATATTTTAGGTACTGATTTTTCCTTTCATATAGATTTAAAATATGGTGCCGGAGCTTTCATCTG TGGTGAGGAAACTGCACTCATAAATTCCATAGAAGGCGGACGTGGAGAGCCTACCGTAAAACCTCCT TTTCCTTCCCAAATAGGTCTCTGGAAAAAACCAACTAATATAAATAATGTAGAAACTCTGGCAAACA TCCCCCCTATTATATTAAAAGGCTCTAAGTGGTTTAGTTCTATAGGAACTGAAAAGAGTAAAGGAAC CAAAGTTTTTGCCTTAGCAGGCAAGATCAATAATGTTGGCCTTGTTGAGGTACCTATGGGTATAACC TTGCGGGAAATAATATATAATTTAGGCGGAGGTATTCGCGGTGGTAAAAAATTTAAGGCTGTTCAAA CTGGCGGTCCTTCTGGCGGGTGCATTCCTGCAGATCATTTAGATACTGCCATTGATTACGAAAGTCT TACTGAAATAGGCTCCATGATGGGTTCTGGTGGAATGATAGTTATGGATGAAGATAATTGTATGGTG AATATAGCCAAATTCTATCTCCAATTTAGTGTAGATGAATCCTGTGGAAAGTGCACTGCCTGCAGAA TCGGGAATAAAAGACTTTTAGAAATTTTAGAGGATATCACTAAAGGAAAAGGTACCATGGAACATCT TGAAGGATTAAAAGATTTATCCTATGTAATAAAGGATTCAGCCCTATGTGGTCTTGGTCAAACATCA CCTAATCCAATTATAAGTACAATGAAATTTTTTTGGGATGAATATATAGCCCACGTAAAAGATAAAC GCTGTCCTGCTGGAGTTTGCACTGCACTTTTAAAATACAATATAAATTCTGAAAAATGTATTGGCTG CACAGCCTGTACAAAGGTATGCCCTAAAGGAGCTATTTCCGGAGAAATAAAAAAGTCACATGTAATA GATAAGTCAAAATGTATAAATTGTGGTGCATGTAGTAGTATTTGTAAGTTTTCTGCTATTACGAAAG AATAA >Gene ID No. 39: RCCC01504 Contig0001_3806829_3805096 ATGGTAAATTTAACTATAAACGATATAAAGGTTTCTGTCCCAGAAGGCACTACAATTTTAAACGCTG CAAAAAAAGTAAACATAAATATACCTACTCTCTGCTATCTTGATCTTCACGATATAAAAATGGTAAA TAGGACTTCCTCCTGCAGAGTCTGCCTTGTTGAAATTGAAGGCAGGCGAAATCTTGCACCTTCATGT TCTACAGAAGCTTTCGAAGGTATGATAGTTAGAACAAATAGTGCCAGAGCTATAAAAGCAAGGCGTA CTATGGTAGAACTTTTATTATCAGATCATCCTACCGACTGCCTTGTATGTGAAAAGAATACTCAATG TCAACTTCAATTAATCGCTGCTGAATTAGGTATAAGAAAAATAAGATATAAAGGTGCTATGTCTAAT TACAAAAAGGATTCATCAAGTGGTGCTATATATAGAAATCTTGATAAATGTATAATGTGCAGACGAT GTGAAACCATGTGCAATGAAGTTCAAACCTGTCAGGTTTACTCTGCAGTAGATAGAGGCTTCGAAAC TGTAGTATCCCCTGCATTTGGTCGTCCCATGGTTGACACGCAATGCACATTTTGCGGTCAATGTGTA TCCGTATGCCCAACTGCTGCATTAACTCAAGTTAGTAATGTAGCTAAGGTATGGGAAGTACTAACTG ATCCTGATAAATATGTAGTAGTTCAAACTGCCCCTGCTATAAGAGTTACTTTAGGTGAAAAATTCGG TATGGAACCTGGAACTATTGTAACTGGCAAAATGGTATCTGCTCTTAGAAGATTGGGCTTTGATAAG GTATGTGATACCGATTTTGCAGCAGATGTAACTATTTTAGAAGAAGCTCATGAATTTATAGATAGAC TTCAAAACGGCGGAAGACTTCCAATACTCACAAGCTGCTGTCCCAGCTGGGTTAAATTTATAGAACA TCAATTTCCTGATCTTTTAGATATACCTTCAACTTGTAAGTCTCCACACATAATGTTTGGTACTTTA GCTAAAACATATATGGCAGAAAAATTAAATATTGATCCATCTAAAATTGTAATAGTTTCAGTTATGC CATGTATTGCAAAAAAATATGAAGTAAGCAGAAAAGAACTTCAATATGAAGGTCATAAAAATGTTGA TCTTGTAGTTACCACAAGAGAGCTTGCAGATATGATAATGGAAGCAGGAATAGATTTTAATAAACTT CCTGATGAAGACTTTGATAAACCTTTTGGAGAATCCACAGGTGCTTCTGTAATATTTGGAACTACCG GCGGTGTAATTGAAGCAGCTCTTAGAACTGCTTATGAATGGATTACTGGAGAGACTTTAAAAGAAGT AGAATTTCATGGTGTAAGAGGACTTGATGGACTTAAAGAAGCCAGTATAAATATTGGTGGTAAAGAA ATAAACATTGGCGTAGCTCACGGTCTTGGCAACGCAAGAAAACTTCTTGAGGAAATAGAATCTGGTG AATCAAAATATCACGCTATAGAAATAATGGCATGTCCTGGAGGATGTATTGACGGAGGAGGTCAGCC GTATCATTTTGGAGATTTAGATATTGTAAAGAAAAGAATGGACGCTTTATATAGAGAAGATAGAAAC AAACCTCTCAGAAAATCTCATGAGAATCCTGAAGTTCAAGCTCTATATAAAGAATTTATTGGAGATG TAGGCGGAAAAAAAGCTCATGATCTCCTTCACACTCATTATATAAAAAGGCAAAAGTTATAA >Gene ID No. 40: RCCC02998 Contig0001_914271_913393 GGTATGTATAATTCCCTTAGACGTGAATTTAATATGCTATAAGTATACAAGCTTAAGAAGAATATAT TAGAAATGATTTAAAAGATAAAGCTACTTTAAAAAATAAGGTGGTTTTATTTTTTTGTATAAATACA CGTTATATTAATTGTCTTTTAATTATATAAATAATATAGAAAATTAAAAGGCAGAGTGATAGGTAAA TGAATGTTCGAAACAAGGGTATATGTCCTTTAATCGTAGATAAGGAACGCAGTTCAAAGGCTTTTAC TAGTGAAGCTATAGATTTAATTAAAAGGGGAAAGACGAAAAAATTAAATGCTATATGGCTTGAAGTA ACAGGATGTTCAGGAAATATTATTTCTTTTTTAAATAGTGAAAATCCTGGACTCGATTATATTTTAG AAAAACTCATTAATTTAAAATACAACAATACTCTAATGACTTCAGAAGGTGAGTATGCTTTTAAACA ATTCTTAGATACATTGGATACTGAATTTATACTACTAGTAGATGGAGCGGTATCTACTGCTCAAAAT GGTTTTTATAATATTGTTGCCAATTATGAAGGAAAACCTGTTACTGCACTTGAAGCTGTAAAAATGG CAGGAGAAAAAGCAAAGTATGTTCTCTGTGTAGGAACTTGTGCATCCTATGGTGGAATTTCTGCCGC CAGGCCAAACCCATCAGAAAGCAAAAGTGTTAAAGAAATACTAAATCGTGAAGTCATAAGACTTCCA GGCTGTCCATGCCATCCGGATTGGGTAGTTGGAACTTTAGCACATTTAGTTGCTTTTGGCAAACCGC AATTGGATGAAGATGGAAGACCTCTTCTTTTTTATGGAATTACCATTCATGATAGGTGTACAAGAAG GGGATTTTTTGATAACAGAATTTTTGCAAAAAAATTTGGAGAAGATGGATGTATGTTTAAACTTGGA TGCAGGGGGCCTGTAACTAAAACAGATTGTCCTAGGAGAAAGTGGAATGGATATGTGAACTGGCCTG TTGAAGACAATACCAACTGTATAGGATGTGCAAATTCTAGATTTCCAGATGGTATGGAACCATTTGT AAGGTATTAG >Gene ID No. 41: RCCC02997 Contig0001_913376_911994 ATGAAAAAGAAAATTACCATTGATCCAATTACGAGAATAAGTGGTTTTTTGGAAACTAAAGTGCAAG TAGAAAAAAATATTATAGTAGATGCTGAAACTAGTGGATTGCTTTTTAGAGGATTTGAAAAAATGTT AAAAAACAGACAGCCGCTGGATGCAGTATATTTTACAGAAAGAATTTGTGGGATATGTTCAACAGCT CATGCTGTGGCAGCTGCTACAGCTCTTGAAGATGCTTTGAAGATAAAAATTAGTGTAAATGATTCGT ATATGCGTAATTTAATACATGGTTTTGAATTTATACAAAATCATATAAGACATTTTTATAATTTGAC TATACCAAGTTATGTGAAGATGCCCAATATAAATCCTCTTTTTTCAGATCAATATGAAGATTATAGA TTACCTTATAACTTAAATAAAAAGATAAGTGAAGATTATATTGAAAGTATTAAATACAGTAGGTTAG CCCATGAAGGATTGGCTACTCTTGGAGGAAAGGCTCCCCATAATCACGGAATTTTTGTTGGAGGAGT TACCATAAATATAGATCCATATAAACTTACAAAAGTTAAATCTATTATTTCTCAAATTAATGAATTC GTAAGTAGTGTTATGTTAGAGGACATGAACATAATTTCAAAATACTATGCTGATTATTTTAAAATGG GAAAAGCCTATGGAAACTTTATGACTTATGGAATTTTTGATAAGTATGCTGATCCTGAGATAAGTTA TGTAGGACCTTCTGTCTTAATAAATGGACAAAAGCATAACTTTAATAGTAATAAAATTACAGAGAAT ATACTTTACACCTGGTACATGAATGATGATGAAACAATAAATTTATCTAAAGAAACAGGTTACAGCT TTATAAAATCGCCAACTTATGATGGCTATTCTATGGAAGTAGGACCTCTAGCAAGATTGATACTTTC AGGTGAGTATACTGGTGGAAGTTCATGTATGGACAGAAATGTTGCCAGAGTACTTGAAACAAAAAAG ATTTTAGAAATTATGCAAGGACTTGCAGATAGAATTAAGCTTATTCCAGCAGAACAAAGAATATATG AAATCCCAGATAAAGCATTTGGTGCAGGATTAATTGACACAACTAGAGGATCCTTGGGACACTGGAT AAGTATAGAAGATAAATTTATAAAGCATTACAATATTATAACTCCTACAGTGTGGAACATGGGGCCA AGAAATCAATCAGGTGCGCTTGGAATTGGAGAAAAATCTTTACTTGGAACGAAAATAAAAGATATAA AGCAGCCTATAGAAGTTGGGAGAATTATGAGGTCCTTTGATCCTTGTGTTTCCTGTGCAACTCATTT GATAAGTGATGCATATGAACCAGTGGACGTACAGGTTATAGTATGA >Gene ID No. 42: RCCC02996 Contig0001_911994_911533 ATGAAAGCAAAAGTTATTGCTCTAGGAAATATATTAATGGAAGACGATGGCATTGGAATTAAGATCC TGGAAAATATAAAAGAGGAACTTGCACATAACCATATTCAATCTATAATAGGAGAAACAGATGTGGA ATACTGCATTTCCCAAGTAAAAGATGGTGATTTTATATTTATAATAGATGCTTCTTATAATGGAAAA GTTCCAGGTACGATAACAGTTGCCAGCTTACAAGATTATAAGTGCAAAAACAAATATTATACCCAGC ACAGCTATAGCTTCATAGACATTATAGGAGTTTACTACAAATCATTAACTGGGTTTATTATTGAAAT TGAAGCAGCTAGTGTAAGCTTTAAATTGGGACTTAGCCATAATTTACAAAGTAAGCTTAAGGATATT TCAAAAGATGTATTGAAAAATATTTTTCTGAGATTGAATGATAGAGCAGAGGAGGAAAAATAG >Gene ID No. 43: RCCC02995 Contig0001_911529_911119 TTGGATTTTTATTTAATGAAAAAGTTGAAGATAATTAGGCGAAAAATAACTTTTTATAAAAAAAGTA GTATGTTTGCTGTATGCCCTTTTATAAAAAGCTATTATGGACATCTCATGAATATTCAAATAGGGGA ATTAGAAAAACTAATGAATACAATGAACAAAGATATAGTAAGACAGGAAAAACAATTTACTTTGGAA GAACTTTCAAAATACAATGGTGCTGGTGGCTCTCCGGCGTATGTTGCTGTAAATGGAATAGTGTATG ATGTGAGTTTGTCTCCTGTATGGGGTGGAGGGACGCATTTTGGTCTGTATGCTGGAAAAGACTTAAC TTTACAATTTAGGGCATGTCACAGTGGAGAAATAAAGATATTAAATGGTCTACCTAAAGTGGGAGAG TTAAAAATTTAA >Gene ID No. 44: RCCC01825 Contig0001_3489615_3490466 ATGAATACTGTAATTATGATTTTAGTTGTAATGACTGTTATAGGTCTTATATTTGGACTTGTTTTAG CCTATGTAAATAAAAGATTTGCAATGGAAGTAAATCCACTTGTGGACTTAGTAGAAGATGTACTTCC AAAAGGCCAATGTGGAGGGTGTGGATTTGCAGGATGTAAAGCTTATGCAGAAGCTGTTGTTTTAGAT GAGAGTGTACCTCCAAATCTTTGTGTACCTGGAAAAGCAGCAGTTGCAGAACAGGTGGCAAAGTTAA CGGGTAAATCTGCTCCACCTATTGAACCTAGAGTTGCACATGTAAGATGTGGTGGAGATTGTACAAA GGCAGTTAAAAATTTTGAATATGAAGGTATACATGATTGTGTAGCTGCAAATTTACTTGAAGGTGGA CCTAAAGCTTGTAAATATGGATGTCTGGGATTTGGGACATGTGTAAAGAGCTGTCCTTTTGGAGCTA TGGCAATGGGTTCAAATGGACTTCCAATAATTGATACAGATATATGTACAGGTTGTGGTACCTGTGT AAGCGCGTGCCCAAAACAGGTACTTGGATTTAGGCCTGTAGGTTCTAAAGTAATGGTTAATTGTAAT TCTAAAAATAAAGGTGGAGCTGTACGTAAGGCATGTAGTGTAGGATGTCTTGGATGTGGATTGTGTG CTAAAAATTGTCCAAATGATGCCATTAAAGTAGAGAACAATCTAGCAGTAGTAGACCAAAGTATTTG TGCGTCATGTAGTGAAGCTACCTGTCTTGCTAAATGTCCTACAGGAGCTATTAAGGCTATTGTAAGC GGTACAGACTTACAACAGCAGAGCAAGAATGAAGCTGCTGCAAATTCATAA >Gene ID No. 45: RCCC01826 Contig0001_3489018_3489596 ATGGCATCTTACCTTACTCTTTTTATAAGTGCAGTAGTTGTAAATAACTATGTTTTAACAAGGTTTT TGGGACTTTGTATATTCTTTGGTGTTTCTAAGAATTTAAATGCTTCTGTAGGTATGGGTATGGCTGT TACTTCTGTTATTACTATGAGTTCAATATTGGCCTGGGTAGTATATCATTTTGTACTTATACCATTT AATTTAACTTTCTTGAAGACAGTAGTTTTTGTACTTCTTATTGCTAGTTTTGTACAGCTTTTGGAGA CTATTATTAAAAAGCAGGCACCAGCCCTATATAATATGTGGGGAATATACCTTCTTTTAATAGCTAC AAACTGTATAGTACTTGCTGTACCTATATTAAATGCTGATTCTAACTTTAATTTTTTACAGAGTGTT GTTAATGCGATAGGATCTGGGCTAGGCTTTGCTATGGCTATAATTTTGATGGCAAGCCTTAGAGAAA AATTGAGATTAGCAGATGTACCTAAACCTTTAGAAGGTCTTGGAGTAGCTTTTATTTTAGCAGGAAT GTTAGCCCTAGCTTTCCTTGGTTTTTCAGGTATGATTTCTATGTAG >Gene ID No. 46: RCCC01827 Contig0001_3488377_3489015 ATGAAGAATTTGTGGAATATATTTAAAAAAGGATTGATTGCAGAAAACCCCATATTCGTACTTGCAC TTAGTTTGTGTCCAGCACTGGCAACTACAAGTACAGCTGTAAATGGATTTACCATGGGGCTCTGCGT GCTATTTGTTATAACTTGTAATAATACTGTGGTTTCTATAATTAAGAATTTTGTAAATCCTAAGGTA CGTGTACCTGTATATATCACTTGTATAGCAACTATAGTTACAGTAGTGGAACTTGTTATGCAGGCTT ATGCACCTCTATTATATAAGCAATTGGGAATTTATTTAGCATTGGTAGTTGTATTTGCTATAATACT TGCCCGTGCAGAGACATTTGCATCTAAAAATCCTGTAGTTCCTTCTTTCTTTGATGGACTTGGAATG GGATGTGGATTTACTTTGGCACTTACTATAATAGGAATGATACGTGAATTATTTGGATCTGGAGCTA TATTTGGTTTTAATGTATTTGGGGCTTCATATAATCCAGCTTTGATTATGATACTTCCACCTGGAGG ATTCATACTTATAGGATATTTAGTTGCTATAGTAAAAGTTTATAACCAACATATGGAGAAAATTAAA ATGCAAAAATTAGAACAAGCAAATGGAGGTGAAGCATAA >Gene ID No. 47: RCCC01828 Contig0001_3487817_3488371 ATGGCTAAAGATAAAGATCAAAATAGTATTTTTGCAATTACTAAGAACTTAACCATTACGTGTTTTA TATCTGGAATTATAATAGCTGCGGTTTATTATGTAACATCACCAGTGGCAGCACAAAAACAAGTTCA AATACAAAATGATACCATGAAAGTTTTAGTCAATGATGCTGATAAATTTAATAAAGTAAATGGTAAA AAGGATTGGTATGCAGCTCAAAAAGGAAACAAGACAATTGCATATGTTGTACCTGCAGAGAGTAAAG GTTACGGTGGAGCTATAGAGCTATTGGTAGCTGTTACTCCAGATGGAAAAGTAATAGATTTCAGCAT TGTATCTCATAATGAAACTCCAGGACTTGGAGCAAATGCTTCAAAGGATTCTTTTAGGGGACAGTTT AAGGATAAAAAGGCGGATGCCTTAACAGTTGTAAAAGATAAGTCTAACACTAAAAACATTCAAGCTA TGACAGGAGCTACAATTACGTCAAAAGCTGTAACTAAAGGAGTTAAAGAAGCTGTTGGGCAAGTTAC TACGTTTACGGGAGGTAAGTAA >Gene ID No. 48: RCCC01829 Contig0001_3486815_3487807 ATGGCGGAAGCACAGATAAAGAAAAATATTTTTACTATTTCGTCATCACCTCATGTTCGTTGTGATG AATCTGTTTCTAAGATAATGTGGAGTGTCTGTTTAGCACTAACTCCAGCTGCGATTTTTGGCGTATT TAATTTTGGAATTCATGCTTTAGAAGTAATTATAACAGGAATTATAGCTGCTGTAGTTACAGAGTAC CTTGTAGAAAAAGTTAGAAATAAACCTATAACTATTACAGATGGAAGTGCTTTTTTAACAGGACTTT TACTTTCTATGTGTTTACCTCCTGATATTCCACCTTATATGGTAGCTATAGGATCTTTTATAGCAAT AGCAATAGCTAAACATTCTATGGGAGGACTTGGTCAGAACATATTTAATCCAGCTCATATTGGAAGG GCTGCACTAATGGTTTCCTGGCCTGTAGCAATGACAACATGGTCAAAATTAAGTGCCAGTGGTGTAG ATGCTGTAACCACAGCAACTCCTCTTGGAATTTTAAAGCTTCAAGGTTATTCAAAATTACTTGAGAC TTTTGGAGGTCAAGGTGCACTTTACAAGGCAATGTTCTTAGGTACTAGAAATGGAAGTATAGGAGAA ACTTCTACAATATTACTTGTTTTAGGTGGACTTTATCTAATATATAAAAAATATATTAACTGGCAGA TTCCAGTAGTAATGATCGGTACTGTAGGAATACTTACCTGGGCTTTTGGAGGAACTACGGGACTTTT TACAGGAGATCCTGTATTTCATATGATGGCAGGCGGACTTGTAATTGGAGCTTTCTTTATGGCTACT GATATGGTAACAATTCCTATGACTATTAAAGGACAGGTTATTTTTGCATTAGGTGCAGGTGCGCTTA CATCACTTATAAGATTAAAAGGTGGTTATCCAGAAGGCGTATGTTATTCAATATTACTTATGAATGC AGTTACTCCTCTAATAGATAAGTTTACACAGCCAGTTAAATTTGGGACAAGGAGGTAA >Gene ID No. 49: RCCC01830 Contig0001_3485423_3486793 AACTTTAATTAATAAGAGTATCTTTTAAAGTTAACTGACATTTAATAGATAAATTGTCATTATATAT TATTTCCTATAGTATATAATTTTATAACGGATTATGGAAAATTCTATAATCTGTTATAAAAATTATG TTTATATTTATTTTGCAGTTTCGTTTATATACATGCTGTAAAAATTATTGAAAGAGGTGTTTAAGAG TGTTAAAAAGTTTTCGAGGTGGAGTACACCCGGATGATAGCAAAAAGTACACAGCTAATAAACCTAT AGAAATAGCACCTATACCAGACAAGGTGTTTATTCCCGTTAGACAGCATATAGGTGCTCCTACATCT CCTGTAGTACAAAAAGGAGATGAGGTAAAAAAGGGACAACTTATTGCGAAGAGTGATGCTTTTGTTT CAGCCAATATATATGCATCTACTTCTGGAAAGGTTGTAGATATAGGAGATTACCCACATCCTGGTTT TGGAAAGTGTCAAGCTATAGTTATTGAAAAAGATGGAAAAGATGAGTGGGTAGAAGGAATACCAACT TCACGTAATTGGAAAGAGCTAAGTGCAAAAGAAATGCTTGGAATAATAAGAGAAGCAGGCATTGTAG GAATGGGAGGCGCAACTTTTCCTGTTCATGTTAAACTTGCACCACCACCAGATAAAAAAGTAGATGT TTTTATTTTGAATGGTGCTGAGTGTGAACCTTATTTAACTGCAGATTATAGGTCCATGTTGGAAAAA TCAGATAAGGTAGTTGCTGGAGTTCAAATAATTATGAAAATCCTCAATGTGGAAAAAGCATTTGTAG GTATTGAAGATAATAAACCAGATGCCATAGAAGCTATGAAAAAAGCTTTTGAAGGTACAAAAGTACA AGTAGTAGGCCTTCCTACTAAGTATCCTCAGGGTGCTGAAAAAATGCTTATAAATGTTTTGACAGGT AGAGAAGTTCCATCAGGTGGATTGCCTGCAGATGTAGGTGCGGTTGTTCAAAATGTAGGTACATGCA TAGCAATAAGCGATGCAGTGGAGAGAGGAATTCCACTTATACAGAGAGTTACAACTATAAGTGGAGG TGCTATTAAAGAGCCTAAAAATATATTAGTTAGAATTGGAACTACATTTAAAGATGCCATTGATTTT TGTGGAGGATTTAAGGAAGAACCAGTTAAAATAATTTCAGGTGGACCTATGATGGGATTTGCCCAAT CAAATTTGGATATTCCAATAATGAAGGGTTCATCAGGAATACTTGGTTTAACTAAAAATGATGTAAA TGATGGAAAAGAATCTTCTTGCATTAGATGTGGCAGATGTCTAAAAGCCTGTCCTATGCACTTGAAT CCAAGTATGTTAAGTATTCTTGGACAAAAAGATTTATATCAAGAAGCTAAGGAAGAATATAATCTTT TGGACTGCGTAGAATGCGGCAGCTGTGTATATACATGTCCTGCTAAACGAAGAATTGTACAGTATAT TAGATATTTAAAATCAGAAAATAGAGCTGCAGGGGCAAGGGAAAAGGCTAAAGCAGAAAAGGCTAAA GAAAAGAAAGAAAAAGAAGAGGTCTTAAAATAA >Gene ID No. 50: RCCC00393 Contig0001_2563153_2563626 GCTTTTTCACCATTGTTTTTAATACATETGGGAGCATTTCAAATTCCAATAACTTCCAGTGTCATTG TACAATGGGCCATTATTATAATTTTAGCTATATTGGCAAAATTTTTTACATCTAGTATGAAAAAATA CCGGATAAAAAACAAAGTGTTATTGAAATTATTGTTGAAGCAGTAAGAAATTTAGTTACTGAAAACA TGGGAAAAGAGTATGTATCATTTATACCATATGTAGGAACGCTTGCCATATACATTTTAGTAATGAA CATTGCTCCAGTGATGATAGGAGTAAGGGCACCAACGGAAGATCTAAGTGTTGCAGTTGGATTGGCA TTAATAACTTTTGTATTAGTCCAATTTAATTCAATTAAAAAAAATGGTTTAGTGCGTTATTTTGGAG CATATACTAAGCCAGTAGTACCGCTATTGCCAATTAATATTATAGAAAGGCTAGTTCTTCCAGTTTC CCTAAGTCTACGACTTTTTGGTAATTTGACAGCAGGAGCTGTAATTATCGGTATGGTATATAAAGGA TTAGGTAGTATGGCATGGTTTTCTCAATTGTTAATACCAATTCCTTTACACGCTTTCTTTGATTTAT TTGATGGTTCAATCCAAATGATAGTATTTGTTATGTTAACAATAATGAATATAAAAGTTATAGCTGA AGACTAA >Gene ID No. 51: RCCC00394 Contig0001_2563672_2563914 ATGAATTTAGATGCACATTCATTTATATCAGGTATGGCAGCAATAGGTGCAGGTTTAGCTGCTATAG GATGTTTAGGAGGAGGTATTGGAGTTGGAAATGCTGCTGGTAAGGCAGTTGAAGGAGTATCAAGACA GCCAGAAGCAAGTGGTAAAATACTAAGTACATTCTTTGTAAGTGCAGCTTTATCAGAGGTAACAGCT ATTTACTCTCTATTAATAGCTCTTATTTTAGTATTTAAAGTTTGA >Gene ID No. 52: RCCC00395 Contig0001_2563964_2564452 TTGGAATTTAATATGCAAATTGATTGGACTACAGTCGTTATAACAATAATAAATTTTATCATATTGT ATTTCATTCTAAAGCATTTCTTTTTTAAACCTGTCAATAACACTATTACAAATAGGCAGCAAGAAAT TGACAATAAAATAAGAACTGCTGATGAAAATGAAAAGAAGTCTAAACAATTAGTAACTCAACATCAA GAGTTGTTAAAGAATTCAAAACAAGAAGGAAAAGCTATTGTTGAAGACTATAAAAATAAAGCCGATA AAGTTTCCGAAAACATAGTAAATGATGCCCAGAAAGAAGCTCAACTAATATTAGATAGGGCAAAAGT TGAAGCTGAAAGAGAAAGAGAAAAAGCAAAAGACGATATAAAAAATCAAGTGGTAGATTTAGCACTT TTAGTATCATCAAAAGCTTTAGAGGGATCTATTAATGAGCAGCAGCATAGGAAACTTATTGAGGACT TTATAGCTAAGGTAGGTATTTAA >Gene ID No. 53: RCCC00396 Contig0001_2564458_2565000 ATGCATGAGTATTTAGATAGAAGATATGCCCTTGCACTCTATAAAATTGGAGAAGAAAAAGGAAAAG TTAAAGAATACCTAGAAGAATTAAGGCAGGTTGTAGCCGCTATAAAAGGTAATTCTAAATTTTTGGA AATCATGGAACATCCAGAAGTAAGTACATCAGAGAAGAAAAAAATGTTTACTGAAATCTTTAAAGAT AAGGTGAATGAAGACATACTTTCATTCTTATTAGTTCTTATAGAGAAAGATAGAATTAATGAAATTG ATGGAAAACTTAGGGAAATGGAAAATATATATCTTGAGAGTAATAATACTGTTAAGGCAAAAGTAAA AACAGTTATTGCTTTGAATGATGATGAGAGAAACACTTTAATTGAAAAGCTAGAAAAGAAATTTAAT AAGAAAGTTTTGATTGAAGAAGAAATAGATCCTAGTATAATAGGTGGGGTTTATGTTGAGGTAAATA ATGAAGTTATTGATGGTAGTATAAGGTCAAAACTTTCTGAAATGAAAAAAATAATGCTTAAGGGAGA ACAGAGGTGA >Gene ID No 54: RCCC00397 Contig0001_2565008_2566519 ATGAACATAAAACCTGAAGAAATAACTTCAATTATAAAAGATGAAATACAGAAATATGAAAAGAAAA TAGAAACAGTTGATTCAGGTACAATAATTCAAATCGGTGATGGTATTGCTAGAGTTTATGGCCTTAA TCAATGTATGGCAAATGAACTCTTAGAGTTTCCAAATGATGTTTATGGTATGGCTTTAAACCTTGAA CAGGATAATGTAGGTTGTGTTCTTTTGGGTTCCCAGAAGGGAATAAAAGAAGGAGATACAGTTAAAA GAACAGGTAGAGTTGTAGAAGTACCAGTAGGTGAAGCTATTGTTGGAAGAGTTGTAAATTCACTTGG ACAGCCTATTGATGGGAAAGGTCCTATAAAGACATCAGAAACTAGGCCTGTAGATCTTGTAGCTCCA GGAGTTATAACAAGACAGTCAGTTAAAGAACCACTGCAAACCGGGTTAAAGGCTATAGATTCAATGA TACCAATTGGAAAAGGACAAAGGGAATTAATAATAGGAGACAGGCAAACAGGTAAGACTGCTATTGC CATGGATACTATAATAAATCAAAAAGGAAAAGATGTAATATGCATATATGTAGCTATAGGTCAGAAG CAGTCTACTGTAGCTCATATAGTAAATGACTTAACAGAAGCAGGTGCTATGGACTATAGCATAATAG TATCTGCATCAGCATCTGAGTCAGCACCACTTCAGTATATTGCTCCTTATGCAGGATGTTCCATGGG TGAATATTTTATGAATAAGGGAAAAGATGTACTTATAGTGTATGATGATTTATCTAAGCATGCGGTT GCCTATAGAGAAATGTCATTATTACTCCGTAGACCACCAGGAAGAGAAGCATATCCTGGAGATGTAT TCTATCTGCATTCAAGATTACTTGAAAGAGCAGCAAAGCTTTCTGATAAGTTAGGTGGAGGCTCACT TACAGCACTTCCTATAATAGAAACTATGGCAGGAGATGTTACTGCATATATACCAACAAATGTTATT TCTATAACAGATGGTCAGATATTCCTTGAATCAGAGCTTTTCTATGCGGGTCAAAGACCAGCTATAA ATGCAGGTATATCCGTATCCAGAGTTGGTGGTAATGCACAAATTAAAGCAATGAAGCAGGTAGCAGG TACTCTTAGATTGGATTTAGCACAGTATAGAGAACTTGCATCATTTGCTCAATTTGGATCAGACCTT GATAAAGAATCTATGAAAAGGCTTGAAAAAGGTAAGAGATTAACAGAAATATTAAAACAACCTCAAT ACAAACCAATGCCTGTAGAAAATCAGGTAATGATACTGTTTGCAGCTGGTAGAGAGTATATAATGGA TGTACCGGTTGAAAAAGTTGTAGAATTTGAAGGAGAATTCCTTGATTATATGAGTACTCATCATAAA GAAATAGGTGATGAAATAAAAAATAAAAAAATTATATCCGATGAATTAAGTGATAAACTTGGAAATG CTATAGAGGAATTCAAAAAAATATTTTTAGCAGAGGCATAG >Gene ID No. 55: RCCC00398 Contig0001_2566545_2567393 ATGGCAGGGGCAGGACTTGTTACAATAAAAAGAAGAATTAGATCAATAACCAGTACTCAAAAAATAA CAAATGCCATGGGACTCATTGCCACCTCTAAACTTAGAAAAGTTAGAAAAAAGCTTGAGGCAAATAA TAAATATTGTGAACTATTTAGTTCCCTTATGAATGAATTTGTTTTAGGAGCAGAGGGAAGAAACATT TATATACATGGTAATAAAAGCAATAAGAAACTCTACATAGCTTTAAATTCAGATACAGGATTATGCG GAGGCTTTAATGGCAGTGTAGTAAATGAAGCAGATGCTGCAATGTCAAAAAATAAAGAAAATTGCCT TTTGATATCTGTGGGACAAAAAGGAAGAACGTATTTTAAAAGGCTTAAGTATAGTACAGAAGCAGAA TACGTGGATATTTCAGATGTTCCTACTATAAATGAAGCAGATACCATAGTATATAAGGCTCTAGACC TTTATAGAAGTGGCGAGGTTGGAGAAGTTAATATAGTATATACTAAGTTTATTTCAACAGTTAGACA AAAAGTAGTTGTTGAAAAATTACTTCCATTGGAAGCTGATAAAAAAGAAAAAACAAATTATCTTGTT AAATTTGAACCATCAATAGATGAAATGATGGATGAAGTAGTACTTTTACACTTAAAGCAAAAAGTAC TTAACTGTATGATAAATTCAAAAGTAAGTGAACAGGCTTCCAGAATGACAGCAATGGATGGGGCAAC TAAAAATGCAAATGATTTACTGGATAAATTGAATCTTAAATACAATAGAGAGAGACAATCTGCTATT ACACAGGAAATAACTGAAATAGTTGGAGGAGCAGAAGCTCTTAAGTAA >Gene ID No. 56: RCCC00399 Contig0001_2567406_2568800 TTGATGCCAAATATAGGCAAAGTTGTTCAGGTTATAGGACCTGTAGTAGATATAAAGTTTGATACAG AAAACCTTCCTAATATATATAATGCCATAGATATAAAATCAGGTGATAAAAAAATTATTACAGAAGT TGCACAACATTTGGGTGATGATGTAGTAAGAACTATATCCATGGAGAGTACGGATGGATTAATGAGA GGTATGGATGCAGAAGATACAGGATCTCCTATATCTGTACCTGTAGGTGAGCCAGTTTTAGGAAGAC TTTTTAATATGCTAGGACAGCCAATTGATGAAAATGGAGAAGTAAAGGCAGAACAATACTATCCTAT TCATAGACAGGCGCCAAGTTTTGAAGATGCATCTGTTAAGCCTGAAATGTTTGAAACTGGTATTAAA GTTATAGATCTTCTTGCACCATACCAAAGAGGCGGAAAGATAGGACTGTTTGGTGGAGCTGGTGTTG GTAAAACAGTTCTTATACAGGAACTTATAAACAATATAGCAAAAGAACACGGTGGATTATCAGTATT TACAGGTGTTGGAGAAAGAACAAGAGAAGGAAATGACCTATATTATGAAATGCAGGAATCAGGAGTT ATAAAGAAGACTGCTTTGGTATTTGGTCAGATGAATGAGCCACCTGGAGCAAGAATGAGAGTTGCAC TTACAGGACTTACTATGGCAGAATATTTTAGAGATAAAGGTCAGGATGTACTTTTATTTATAGATAA TATATTCAGATTTACTCAGGCAGGATCCGAAGTTTCAGCGTTACTTGGTAGAATACCTAGTGCTGTT GGTTACCAGCCAACTCTTGCAACTGAAATGGGTGCTCTTCAAGAAAGAATAACATCCACAAAACAGG GGTCTATTACATCTGTTCAGGCAGTATATGTTCCAGCAGATGACTTGACTGACCCGGCACCATCTAC GACATTTACGCATCTTGATGCAACTACAGTTCTTTCTAGATCTATATCAGAAATTGGTATATATCCT GCTGTTGATCCACTGGCATCCACTTCAAGAATATTGGATCCAAGGATTGTAGGAGAGGATCATTATA AAGTAGCATCAGATGTTAAACATATACTTGAAAGATACAGTGAACTTCAAGATATTATAGCAATACT TGGTGTAGATGAGCTTTCAGAAGATGATAGATTAGTAGTTATTAGAGCTAGAAGAATTCAAAGATTT TTATCACAACCATTTTCTGTTGCAGAACAATTTACAGGATATCAGGGTAAATATGTTCAAATAAAGG AAACTATAAGAGGTTTTAAAGAAATTCTTGAAGGTAAATATGATGATTTGCCAGAAACTGCTTTCTT ATTTAAAGGAAGTATAGATGAAGTGGTTGAAGCAGCTAAAAATATGGGAAAAAATTAA >Gene ID No. 57: RCCC00400 Contig0001_2568870_2569265 ATGTCAGAAGTTTTAAAATTAACTATCCTTACTCCCGATAGAGAATTCTATGAAGGAGAAGTAGTAG AAGTAATAACGGAAAGTATTCAAGGCGACATAGCAATTCTTCCAGACCATATGCCTTTAGTTACCAC TTTAAAACCTGCAGATACCGAAATCGTTCAAAAAGATGGCAAAAAATTAAAGGCATTTACATCAACC GGAGTACTGGAAGTAATAAATAATGAGCTAAAAATTTTATGTGATTCTTGTGAATGGCCAGATGAAA TAGACATAGATAGAGCAAAAGCTGCTAAAGATAGAGCTGAAAAAAGATTATCTAGTCAGAAAGACGG AGTCGATGTAAAAAGAGCAGAAATGGCATTGGCTAGGGCACTGGCGAGAATTAATCTGAAATAA >Gene ID No. 58: RCCC00086 Contig0001_2233162_2232383 ATATAAGAGAAACTATACTTGCAGGAGCTAATGCTATAGCTTTTACGCCTCCTACTTCGGCTGAAAT TTTAAGACAAATTATGAATGAACATAGGAAAAAATATAAAAATAGAAGACCAGAATAAATATTTACA GTATATTATAGGGAGAGGAGTAACTACTTTTATTTTAATTATTTAAAAATAAAGGATTAGATTAGTA TGAAAGGTATTTTATATTATTTTAGCGGTACTGGAAATACCAAGTGGGTGGCGGATAGGTTTAAGGA AAAATTTCAGCTTTATAATGTAGATATAGACTTAGCATATATTCAATCTCTAGAAGAGAGGAAAATA AAAAAATATGATTTCATAATCATTGGCTTTCCTGTCCATTGGAAATTACCACCTAAAATTGTAACAA ATTTTTTAAATAGACTGAATAATACAAAAGAAAATACAAGGGTTATAGTATATTCTACACAAGGTGC TTCATCATCTTCAGCTTCTTGTTTTGTTGCAGGATGTTTAAAGAAGAAAGGATATGTACCATCTATA CAGATTAGCATAAAAATGCCTAATAATTTTTACTTCTTTATAGGTAAAAAATATAATGAAAGTGAAA TAGAAAATTTGCTTGTTTCTGTTGATAAAAAGATTACAAATATAGTAGAAAGTTTTATAAAGGGGAG GATTGTAAAAGAATCTAATTCTTTAATAAGGCTTCAATTTAGTAAAGTACTGAATAACGTGTTCAAA GGTAGGGTACCTAAATTATCTAGAAATATATCATCAACTAAAGATTGTGTTAAATGTGGATTATGCC TTAGAAATTGTCCTCAAGGTAATATAACATTTGAAAATGGACATGCAGTTTTTCATAGCAAATGTAT TTTATGTTTGAGATGTATACATATATGTCCAATAAATGCAATAAGATATAGAGGTAAGAAAATAGAT CAAACTCAAAAAGATATTATACAGGTATTAGATCTGAATAAATAA >Gene ID No. 59: RCCC00301 Contig0001_2468464_2468646 GAAATTGTTATCCAGGGACATAGCCACTCTTTGCTCACACTTGGAAAAGTGTAAGTATTAGAGTGGG TAGTCATCCGATAAAAAATATTCGTCGCATCTTTGACTTGTTATTTTCTTTCAAATGCCTAAAATTA TCTTTTAAAATTATAACAAATGTGATAAAATACAGGGGATGAAAACATTATCTAAAAGTTAAGGAGG TGTTACATAAGATGGCATATAAAATTACAGAAGAGTGTGTAAGTTGTGGTTCATGTGCTTCAGAATG TCCAGCTGATGCTATAAGCCAAGGAGATAGTCAATTTGTAATAGATCCAGAAAAATGTATAGAATGT GGAAACTGTGCTAATGTTTGTCCAGTAGGAGCACCAGTTGAAGAAAACTAA >Gene ID No. 60: RCCC00336 Contig0001_2498650_2498835 ATATGGAAGCTAAAAAGGCAGAAGAATACATATCAAACTCATTGGAATATAATGATTTGCTTAATAA CTTTATAAAAAAATTAAAATAGAAATTAAATTATTATAATAAGCATTATTTTTGGAATAATATAAAG TGTACTTTAAAGTAACTAATTATATAGCGAGGAGTGAAAACTTGTTATTAATAACAGGAAAATAGTA TGAAAGCTGTAGTTGATAAAGACACTTGTATAGGATGTGGGTTATGTCCAAGTATATGTCCAGAGGT TTTTCAGATGGATGATGATGAAAAAGCTAAGGCAATTGAAGATAATGTCCCAGGAGAAGCAGAGGAC ACTGCGAAGGAAGCAGAGGACAGTTGTCCTGTTTGTGCTATTAAGGTAAGCTAA >Gene ID No. 61: RCCC01168 Contig0001_4158324_4159373 GTTGAAACATTTCCAATTTTCGAAAATTGTCCTATAGTGTACATAAAAACTCCTAATATTTATTTCC TTCGAAGTGATTAATTATATTTTAAACTTTACCATAATGTCAAAGTCAATAGAGATAGAGTCAAAAA TTGAATTATGGGATTTGCTGGGTAAACTATGCTATAATTTTTAGTAGAATAAAAAATTTAATTTATT GCTGGAGGTTTATTCTATGAAAAAAGTTTATTTTAAGGCTATTGATTCATACTCCAAAACAGAAGAG ATAAGTGATGCTGCTGGCAAACTCTTAAGAAAAGTAGTGGAAGAGGAGCATATAAGTCTTGAAAAAT TCATACCTCTCAAGGTTCATTTTGGAGAAAAGGGTAATAATACTTTTATACAATCAAAAAATTTTGT TGGTATAATAAATTATTTAAAGGAAAATAACATAGATAGTGCATTTATAGAGACGAATGTTCTCTAT AGAGGTGAAAGAACTACAAGAGAAAAGCATTTGAAACTAGCAAAAGATCATGGGTTTACGGAACTCC CTATAATAATAGCCGATGGTGAACATGGAGAAGATTTTGAGGAGATTGAAATCAGTAAAAAAAATTT TAACAAATGTAAGGTAGGAAAACAAATTGCAAACAAAAAACAGCTTATTGTCCTAAGTCACTTTAAA GGTCATATACTTGCTGGTTTTGGAGGTGCCATAAAACAACTTGGAATGGGATGTGCATCAAGAGGAG GAAAGCTTGCCCAGCATGCAAATTCTACACCTAAAATTAACTTTTTTAAGTGTAAAGGCTGCAGCGC TTGTGCAAAAAAGTGCCCTCAAAATGCCATAACTGTAAATAGAAAGGCAAAGATCAATAAAGACAAG TGTATTGGATGTGCCTCTTGTATGGCAATATGTCCACAGGGAGCTATTTACCACAGCTGGATTGGAT CTATGACCAAATCTTTTAATGAAAGACTTGCAGAATATGCTTATGCTGCAGCAAAGGAAAAAAATAA TATTTATATAACCTTTGCTTTTAATATAACTAAAAATTGTGACTGTGAAGGACACAATATGAAATCA ATAGCAAATGATATTGGAGTTTTTGCTTCAACGGATCCTGTAGCTATTGATAAAGCATGCCTTGATG TTCTTGATAAAAATAATGATAGAATTGTATTTAAAAGGGGCAGGTATACTCTTGATTATGCAGAAAA AATAGGCTTGGGTAGTAAAAAATATGAACTTGTTGAAATAAATTAG >Gene ID No. 62: RCCC02435 Contig0001_320737_320336 ATCTGATGGCTACCTACTGTAACACTCCCACGCACACAGCGAAAGCGACTATCACCAAATCAAAGAT TTGGGATATCTGCTTTTCCCACTAAGTAAGATTCGTTGATATAAACCAAAATAATAGGCATAAAATT TGCGGTATTGATATATACCTTATATATTTGTATAATTAAGATATATGTACAAAGTATATATAAATAA TGTTTAAAGGGGAATGTATTATGAAAAAATTAGTTGTTAAAGATAAGTCTTTATGTATGTCTTGTTT AAGTTGTGAAATGGCTTGTTCCGAGGCATTTTACAAAACCTACGGCAATTCTTGTATTAAGATTGAT GAAGGAAAAGATGGATCTGTAGATTTAAAAGTATGCAATCAATGTGGAGTGTGTGCTAAAAAATGTC CTGAAGAGGCAATTAAACAAAATGCTAAGGGAATATATATGATAGATAAAAAAGCTTGTACTGGCTG TGGTACATGTGTAGAAGCCTGTCCAAAAGGTATTATTGTAAAAGTAGAAGACAAGCCTAATCCAAGT AAGTGTATGGCATGTGGTATTTGTGTTAAAGCTTGTCCTATGGGAGTACTTGAAATTCAAGAAGATT AA >Gene ID No. 63: RCCC02890 Contig0001_794294_793599 ATTGTTATGTTGCGGTTGTGGATGCAGATAATTGTACAATAAGTAGTAGAGAAGGAAACGAAATTTT CGTTTCCTTTTCTCTATTTAAAGAAAGATATTGTTATCTGTTATGTACTCTTTAGACTTAGTAACAT ATGTTACGGATTTTGTGACTGCATTTTATTATAATATAGACAGTAAAATAAGGAGGAGAAAATATTA TGATAAGAAAAATTGTTAATATAAATAAAGAGAAATGCAATGGATGTGGACTTTGCGTAAATGCATG TCATGAAGGTGCTATTGAACTTGTAAAGGGAAAAGCTGAACTTATAAGTGATGAGTACTGTGACGGA CTTGGTGACTGTCTTCCTGAATGTCCTACAGGAGCTATAAGTATAATTGAAAGAGAAAGCAAGGATT ATGATGAGGAACTAGTTGCTAAAAAGGCTAAAGAAAAGGAAGAAGTTATGCCTTGTGGATGTCCAGG TACAGCAGCTAGAAGAATAGAGAGAGCTTCAGATAAAAATGCGTATACAGATAAAAAGAATTCGGAA GATTTTAGTGCCGCTTCTGAGTTAACACAGTGGCCTGTTCAATTGAGACTTATAAATACAAATGCAC CTTATCTTAAGAATGCGAAGTTACTTGTAGCTGCTGATTGTACTGCATATGCCTGTGGAGATTTTCA CAAAAAATTTATAAAGGATCACATTACAGTAATAGGGTGTCCTAAGTTAGACGACATTAAATATTAT GAAGATAAATTAACTGAAATTATAGAAAAAAATGATTTGAAAAGTATAACTGTAGTGAGAATGGAAG TACCATGCTGCTCAGGCATTGTAAATGCAGTGAAAAATGCAATGCTTAGGGCAAAGACAATAATTCC TTATGAGGAAGTTATAATATCAATTTAA >Gene ID No. 64: RCCC03063 Contig0001_983504_982689 AAGAATGGTGTTTTATAATATGCTTAATATGCTGCTGGATTCCCTAGAAGGTGATATGAATGGGGAT GAACGAAGAAATGTGGTAAGATTTGCGTTTAAATACAATTATGATGGATTTAAAAGATTACTTACAG AATACACTAAGTAAAATTGTGAATGGGAAAAGTGTAGAATTACATTGAAAAAGGAGTAAAAACTTTA TGATGAATGTAAATAGTGAAAAGTGTATAGGATGCGGACAATGTGTTAAAGATTGTTTTGCAAGAGA CATAGAGATAATAAATGGTAAAGCTAAAATTAATAATATTACTTGCATAAAGTGCGGGCACTGTATT GCAGTGTGCCCTAAAAATGCAGTATCAACGGACGAATATAACATGGAAGATGTAAAAGAATATAATA AAGAATATTTTTCCATAGATGCTGATACTTTATTAAATTCTATTAAGTTTAGAAGAACTATAAGGCA GTTTAAAGACAAAGAAGTAGAGAAGGAAAAACTGCTTAAAATTATAGAAGCTGGAAGGTTTACTCAA ACAGCAAGTAATATGCAGGATGTATCTTATACAGTTGTAAGAGATGGAATACAGGATTTAAGAAAAT TAATAATTGAAAGTTTAAATCAAATTGGAGAAAAAATACTTAAAGATACAAATGCGAAAAATATACT TTATCAAAGATATGCTAAAATATGGATTGATATGTATAAGGAATATAAAGAAAACCCTAAAAATGAT AGATTGTTTTTTAATGCTCCAGTAGTAATAGTTGTTACAGCAAGACAGGAAGTAAATGGAGCTTTAG CATCTTCAAATATGGAACTTATGATTAATTCTTTAGGACTTGGAACGTTGTTTAGTGGTTTTTCTGT TGCGGCTGCCCAAATGGATGAAAAAATAAGTAAGTTTCTTGGAGTTAAGAAAGGAAGAAAGGTTGTA ACTTTCATGATAGTTGGATATCCTAATGTGAAATATCTAAGAACTGTACCAAGGAGAAAAGCAGATA TACGCTGGAAGTAA SEQ ID NO. 2 >Gene ID No. 20: RCCC01717 Contig0001_3590430_3591623 TATAAACTTGTTCAAAGATTTGCAAAAGCTGATGCTATAGGACCTGTATGCCAGGGATTTGCAAAAC CTATAAATGATTTGTCAAGAGGATGTAACTCCGATGATATAGTAAATGTAGTAGCTGTAACAGCAGT TCAGGCACAAGCTCAAAAGTAATAACAAAAAGCATAAATGATTCATTTTTAGGAGGAATATTAAACA TGAAAATATTAGTAGTAAACTGTGGAAGTTCATCTTTAAAATATCAACTTATTGATATGAAAGATGA AAGCGTTGTGGCAAAAGGACTTGTAGAAAGAATAGGAGCAGAAGGTTCAGTTTTAACACATAAAGTT AACGGAGAAAAGTTTGTTACAGAGCAGCCAATGGAAGATCATAAAGTTGCTATACAATTAGTATTAA ATGCTCTTGTAGATAAAAAACATGGTGTAATAAAAGATATGTCAGAAATATCTGCTGTAGGGCATAG AGTTTTGCATGGTGGAAAAAAATATGCGGCATCCATTCTTATTGATGACAATGTAATGAAAGCAATA GAAGAATGTATTCCATTAGGACCATTACATAATCCAGCTAATATAATGGGAATAGATGCTTGTAAAA AACTAATGCCAAATACTCCAATGGTAGCAGTATTTGATACAGCATTTCATCAGACAATGCCAGATTA TGCTTATACTTATGCAATACCTTATGATATATCTGAAAAGTATGATATCAGAAAATATGGTTTTCAT GGAACTTCTCATAGATTCGTTTCAATTGAAGCAGCCAAGTTGTTAAAGAAAGATCCAAAAGATCTTA AGCTAATAACTTGTCATTTAGGAAATGGAGCTAGTATATGTGCAGTAAACCAGGGAAAAGCAGTAGA TACAACTATGGGACTTACTCCCCTTGCAGGACTTGTAATGGGAACTAGATGTGGTGATATAGATCCA GCTATAATACCATTTGTAATGAAAAGAACAGGTATGTCTGTAGATGAAATGGATACTTTAATGAACA AAAAGTCAGGAATACTTGGAGTATCAGGAGTAAGCAGCGATTTTAGAGATGTAGAAGAAGCTGCAAA TTCAGGAAATGATAGAGCAAAACTTGCATTAAATATGTATTATCACAAAGTTAAATCTTTCATAGGA GCTTATGTTGCAGTTTTAAATGGAGCAGATGCTATAATATTTACAGCAGGACTTGGAGAAAATTCAG CTACTAGCAGATCTGCTATATGTAAGGGATTAAGCTATTTTGGAATTAAAATAGATGAAGAAAAGAA TAAGAAAAGGGGAGAAGCACTAGAAATAAGCACACCTGATTCAAAGATAAAAGTATTAGTAATTCCT ACAAATGAAGAACTTATGATAGCTAGGGATACAAAAGAAATAGTTGAAAATAAATAA >Gene ID No. 21: RCCC01718 Contig0001_3589384_3590382 GATTAAATTTTTACTTATTTGATTTACATTGTATAATATTGAGTAAAGTATTGACTAGTAAAATTTT GTGATACTTTAATCTGTGAAATTTCTTTAGCAAAAGTTATATTTTTGAATAATTTTTATTGAAAAAT ACAACTAAAAAGGATTATAGTATAAGTGTGTGTAATTTTGTGTTAAATTTAAAGGGAGGAAATAAAC ATGAAATTGATGGAAAAAATTTGGAATAAGGCAAAGGAAGACAAAAAAAAGATTGTCTTAGCTGAAG GAGAAGAAGAAAGAACTCTTCAAGCTTGTGAAAAAATAATTAAAGAAGGTATTGCAAATTTAATCCT TGTAGGGAATGAAAAGGTAATAGAGGAGAAGGCATCAAAATTAGGCGTAAGTTTAAATGGAGCAGAA ATAGTAGATCCAGAAACCTCGGATAAACTAAAAAAATATGCAGATGCTTTTTATGAATTGAGAAAGA AGAAGGGAATAACACCAGAAAAAGCGGATAAAATAGTAAGAGATCCAATATATTTTGCTACGATGAT GGTTAAGCTTGGAGATGCAGATGGATTGGTTTCAGGTGCAGTGCATACTACAGGTGATCTTTTGAGA CCAGGACTTCAAATAGTAAAGACAGCTCCAGGTACATCAGTAGTTTCCAGCACATTTATAATGGAAG TACCAAATTGTGAATATGGTGACAATGGTGTACTTCTATTTGCTGATTGTGCTGTAAATCCATGCCC AGATAGTGATCAATTGGCTTCAATTGCAATAAGTACAGCAGAAACTGCAAAGAACTTATGTGGAATG GATCCAAAAGTAGCAATGCTTTCATTTTCTACTAAGGGAAGTGCAAAACACGAATTAGTAGATAAAG TTAGAAATGCTGTAGAAATTGCCAAAAAAGCTAAACCAGATTTAAGTTTGGACGGAGAATTACAATT AGATGCCTCTATCGTAGAAAAGGTTGCAAGTTTAAAGGCTCCTGAAAGTGAAGTAGCAGGAAAAGCA AATGTACTTGTATTTCCAGATCTCCAAGCAGGAAATATAGGTTATAAACTTGTTCAAAGATTTGCAA AAGCTGATGCTATAGGACCTGTATGCCAGGGATTTGCAAAACCTATAAATGATTTGTCAAGAGGATG TAACTCCGATGATATAGTAAATGTAGTAGCTGTAACAGCAGTTCAGGCACAAGCTCAAAAGTAA >Gene ID No. 22: RCCC00020 Contig0001_19768_21588 GGAGAACTGTATTGCTTATTATTTAAGCATTTTATTATAAAATAAAAAAACGTTATTAAATTATTTA CTATGAATTCACTTGATAATCAACACATTGCATGTAATGTTGATTATTGAGTGTTTTTTTGTAACCA TATTTGGCACAATTTATGCTCTATAACATTTCTGAAATAAATATATGTATATGAGGAGGAATTTCAA TGTATGGTTATAATGGTAAAGTATTAAGAATTAATTTAAAAGAAAGAACTTGCAAATCAGAAAATTT AGATTTAGATAAAGCTAAAAAGTTTATAGGCTGTAGGGGACTAGGTGTTAAAACTTTATTTGATGAA ATAGATCCTAAAATAGATGCATTATCACCAGAAAATAAATTTATAATTGTAACAGGTCCGTTAACTG GAGCTCCAGTTCCAACTAGTGGAAGGTTTATGGTAGTTACTAAAGCACCGCTTACAGGAACTATAGG AATTTCAAATTCGGGTGGAAAATGGGGAGTAGACTTGAAAAAAGCTGGCTGGGATATGATAATAGTA GAGGATAAGGCTGATTCACCAGTTTACATTGAAATAGTAGATGATAAAGTAGAAATTAAAGATGCGT CACAGCTTTGGGGAAAAGTTACATCAGAAACTACAAAAGAGTTAGAAAAGATAACTGAGAATAGATC AAAGGTATTATGTATAGGACCTGCTGGTGAAAGATTGTCCCTTATGGCAGCAGTTATGAATGATGTA GATAGAACTGCAGCAAGAGGCGGCGTTGGTGCAGTTATGGGATCTAAAAACTTAAAAGCTATTACAG TTAAAGGAACTGGAAAAATAGCTTTAGCTGATAAAGAAAAAGTAAAAAAAGTGTCCGTAGAAAAAAT TACAACATTAAAAAATGATCCAGTAGCTGGTCAGGGAATGCCAACTTATGGTACAGCTATACTGGTT AATATAATAAATGAAAATGGAGTTCATCCTGTAAATAATTTTCAAGAATCTTATACGGATCAAGCAG ATAAAATAAGTGGAGAGACTCTTACTGCTAACCAACTAGTAAGGAAAAATCCTTGTTACAGCTGTCC TATAGGTTGTGGAAGATGGGTTAGACTAAAAGATGGTACAGAGTGCGGAGGACCGGAGTATGAAACA CTGTGGTGTTTTGGCTCTGACTGTGGTTCATATGATTTAGATGCTATAAATGAAGCTAATATGTTAT GTAATGAATATGGTATTGATACTATTACCTGTGGTGCAACAATTGCTGCAGCTATGGAACTTTATCA AAGAGGATATGTAAAAGATGAAGAAATAGCCGGAGATAACCTATCTCTCAAGTGGGGAGATACGGAG TCTATGATTGGCTGGATAAAGAAAATGGTATATAGTGAAGGCTTTGGAGCAAAGATGACAAATGGTT CATATAGGCTTTGTGAAGGTTATGGAGTACCTGAGTATTCTATGACAGTTAAAAAACAAGAAATTCC AGCATATGATCCAAGGGGAATACAGGGACATGGTATTACCTATGCAGTTAATAATAGAGGAGGATGT CATATTAAGGGATATATGATTAATCCTGAAATATTAGGTTATCCGGAAAAACTTGATAGATTTGCAT TAGATGGTAAAGCAGCCTATGCCAAAATGATGCATGATTTAACTGCTGTAATTGATTCTTTAGGATT GTGCATATTCACTACATTTGGGCTTGGAATACAGGATTATGTAGATATGTATAATGCAGTAGTAGGA GAATCTACTTGTGATTCAGATTCACTATTAGAGGCAGGAGATAGAGTATGGACTCTTGAAAAATTAT TTAATCTTGCAGCTGGAATAGACAGCAGCCAGGATACTCTACCAAAGAGATTGTTAGAAGAACCTAT TCCAGATGGTCCATCAAAGGGACACGTTCATAGGCTAGATGTTCTTCTGCCAGAATATTACTCAGTA CGAGGATGGAGTAAAGAGGGTATACCTACAGAAGAAACATTAAAGAAATTAGGATTAGATGAATATA TAGGTAAGTTCTAG >Gene ID No. 23: RCCC01356 Contig0001_3966524_3969232 TAAAGAGCAATTATGAATAATAATAACATAGAAACAAACAATAAAAGTGAGAATCTTGTTTATCCGA TGACTACTCGCTCTAATACTCCCACTTCTGCAAGTGGGAGTAAAGAGCGACTACGTCCCTGGATAAC GATTTTTCCTAAAGGATAACGTCTTCTAAGTGCTGAAGCACTAAGAATACTGTTAATAAGCATCAGG TGGAGTTAAAACTCCATCTGATGCCAAGAAATCTGTTTATATTTAACAGCATGAAAAATAAGAAAGA GGTGTCATTAATGAAGGTAACTAAGGTAACTAACGTTGAAGAATTAATGAAAAAGTTAGATGAAGTA ACGGCTGCTCAAAAAAAATTCTCTAGTTATAGTCAGGAACAAGTGGATGAGATCTTTAGGCAGGCAG CTATGGCAGCCAATAGTGCTAGAATAGATCTAGCTAAAATGGCAGTGGAAGAAAGCGGAATGGGAAT TGTAGAAGACAAGGTTATTAAAAATCATTTTGTTTCAGAATATATATATAACAAATATAAGGATGAA AAGACCTGTGGAGTTTTAGAAGAAGACCAAGGTTTTGGTATGGTTAGAATTGCGGAACCTGTAGGGG TTATAGCAGCAGTAGTTCCAACAACTAATCCAACATCCACAGCAATCTTTAAATCTTTAATAGCTTT GAAAACTAGAAATGGTATAGTTTTTTCACCACATCCAAGAGCAAAAAAATCAACTATTGCAGCAGCT AAGATAGTACTTGATGCAGCAGTTAAAGCTGGTGCTCCTGAAGGAATTATAGGATGGATAGATGAAC CTTCCATTGAACTCTCACAGGTGGTAATGAAAGAAGCAGATTTAATTCTTGCAACTGGTGGCCCGGG TATGGTTAAGGCTGCCTATTCTTCAGGAAAGCCTGCTATAGGAGTTGGCCCAGGTAACACACCTGCT GTAATTGATGAAAGTGCTGATATTAAAATGGCAGTAAATTCAATACTCCTTTCAAAAACTTTTGATA ATGGTATGATTTGTGCTTCAGAGCAGTCAGTAGTAGTTGTAAGCTCAATATACGATGAAGTCAAGAA AGAATTTGCAGATAGAGGAGCGTATATATTAAGTAAGGATGAAACAGATAAGGTTGGAAAAACAATT ATGATTAATGGCGCTCTAAATGCTGGCATTGTAGGGCAAAGTGCTTTTAAAATAGCACAGATGGCAG GAGTGAGTGTACCAGAGGATGCTAAAGTACTTATAGGAGAAGTTAAATCAGTAGAACCTGAAGAAGA GCCCTTTGCTCATGAAAAGCTGTCTCCAGTTTTAGCTATGTACAAAGCAAAAGATTTTGATGAAGCA CTTCTAAAGGCTGGAAGATTAGTTGAACGAGGTGGAATTGGGCATACATCTGTATTATATGTAAATT CAATGACGGAAAAAGTAAAAGTAGAAAAGTTCAGAGAAACTATGAAGACTGGTAGAACATTGATAAA TATGCCTTCAGCACAAGGTGCTATAGGAGATATATATAACTTTAAACTAGCTCCTTCTTTGACGCTA GGATGTGGTTCCTGGGGAGGAAACTCTGTATCAGAAAATGTTGGACCTAAACATTTATTAAACATAA AAAGTGTTGCTGAGAGGAGAGAAAATATGCTTTGGTTTAGAGTACCTGAAAAAGTTTATTTCAAATA TGGTAGTCTTGGAGTTGCATTAAAGGAATTGAGAACTTTGGAGAAGAAAAAGGCATTTATAGTAACG GATAAGGTTCTTTATCAATTAGGTTATGTAGATAAAATTACAAAAAATCTCGATGAATTAAGAGTTT CATATAAAATATTTACAGATGTAGAACCAGATCCAACCCTTGCTACAGCTAAAAAAGGTGCATCAGA ACTGCTTTCCTATGAACCAGATACAATTATAGCAGTTGGTGGTGGTTCGGCAATGGATGCAGCCAAG ATCATGTGGGTAATGTATGAGCATCCAGAAGTAAGATTTGAAGATTTGGCTATGAGATTTATGGATA TAAGAAAGAGAGTATATGTTTTTCCTAAGATGGGTGAAAAAGCAATGATGATTTCAGTAGCAACATC CGCAGGAACAGGATCTGAAGTTACTCCATTTGCAGTAATTACGGATGAAAGAACAGGAGCTAAATAT CCACTGGCTGATTATGAATTGACTCCAAACATGGCTATAATTGATGCAGAACTTATGATGGGAATGC CAAAAGGGCTTACAGCAGCTTCGGGTATAGATGCATTAACCCATGCACTGGAGGCGTATGTATCAAT AATGGCTTCAGAATATACCAATGGATTGGCTCTTGAAGCAACAAGATTAGTATTTAAATATTTGCCA ATAGCTTATACAGAAGGTACAACTAATGTAAAGGCAAGAGAAAAAATGGCTCATGCTTCAACTATAG CAGGTATGGCTTTTGCCAATGCATTCTTAGGGGTATGTCACTCTATGGCACATAAATTGGGAGCACA GCACCATATACCACATGGAATTGCCAATGCGCTTATGATAGATGAAGTTATAAAATTCAATGCTGTA GAGGCTCCAAGGAAACAAGCGGCATTTCCACAATATAAGTACCCAAATGTTAAAAGAAGATATGCTA GAATAGCTGATTACTTAAATTTAGGAGGAAGCACAGATGATGAAAAAGTACAATTGCTAATAAATGC TATAGATGACTTAAAAACTAAGTTAAATATTCCAAAGACTATTAAAGAGGCAGGAGTTTCAGAAGAT AAATTCTATGCTACTTTAGACACAATGTCAGAACTGGCTTTTGATGATCAATGTACAGGAGCTAATC CAAGATATCCACTAATAGGAGAAATAAAACAAATGTATATAAATGCATTTGATACACCAAAGGCAAC TGTGGAGAAGAAAACAAAAAAGAAAAAATAA >Gene ID No. 24: RCCC03300 Contig0001_1213196_1212027 TGTAAAATAAAATCAGAAATTAGTTAAATATTTAAAATAAAATAAAAATTTATACAATGATGTATGA AAAAGCGATGAAGCTTCTAAAAGAATATTTATATTCTTAGGAAGCTTTTTTTATTTTATTGGTAGCT ATCAAAAAATTACAAAATTTAATATGACTAATGTGAAGTTTCATAGATATTTTATTAAATTGGAGTA TGATTATTGTGAAAAATTTTAATGTTAAACCAAAGGTTTATTTTGGTACTGATGCTTTAAATCATTT GTGTGAATTAAAATGTAAGAAAGCTTTAATCGCTGCAGATCCATTTATGGTTAAGTCATCAACGGTT GATAAAATTACTGAACAGCTTGATAAGGCACATATAGAGTATGATATATTTTCAGATATAGTACCAG ATCCTCCTGTTGAAGTTATTATAAAAGGAGTGCAGGAAGCTGTTAAATTTAAACCTGATGTACTTAT AGCACTTGGAGGAGGATCAGCTATTGATTCTGCAAAAGGAATAAGGTATTTTTGTCAGTATGTAAAT AATGAATTGAATAACGAAATGAAAGAGCCCCTGTTTATAGCAATTCCGACAACAAGTGGTACAGGCT CTGAGGTTACTAACTTTTGTATTGTAACTGATAAGCAAAAAGGAGTCAAATATGCTCTTGTTGATGA CAATTTGACGCCGGATCAGGCGGTACTTGATATTGAACTTGTAAAATCAGTGCCAAAAGCTACCACA TCAGAAACAGGAATAGACGTACTTACACATGGAATTGAAGCATATGTTTCTACAAATAGATCAGATT ATTCTGATGCACTGGCAGAAAAATCAATAAAAATGGTATTTAAATACTTGTTAGCCGCATATGAAAA TGGAGATGATGAAGAAGCTAGAACGAAGATGCATAATGCATCCTGCATAGCAGGTATGGCATTTACA AATGCTTCCCTTGGACTTAACCATGGCATGGCTCATGCACTTGGTGGAAAAATTCATATACCGCATG GAAGAGCAAATGGACTACTTCTTCCATACGTAATAGAGTATAATGCAAACCTTAAAAACTTACAAGG AAAGATAAACCATTCTAGTGCAGCATATAGGTATACTGAAATATCAAAATTCTTGGGACTTCCAGCA TCTAACCAATTTGAAGGTGTTAGGAGTTTGATTGCAGCAGTTAAGATACTGATGAATAAACTTAACT TACCTAAATGTATTAATAATTGTGAAGTTTTATGTGAAAATTTGGATAATGAGATTCATGAGTTATC GATAACTGCCCTAAATGATAGATGTACAAAAACAAATCCGAGAATTCCTGAAATAAAGGATGTTGAA AATTTGTTTAAGAGGGTTTTTTCTAAAGAATAA >Gene ID No. 25: RCCC01567 Contig0001_3730455_3731297 CATAAAAGAAGAGCATGCAATTAGTTTTAAATTATTAGATAGTGTAAAGCGTTATAAACAATTTCTT GATACATACCCTGATTTGGAAGAACGTGTTAAGCAGTGTTATATTGCATCCTATTTAGGAATAACTC CTGTGTCTCTTAGCAGAATAAGAAGAAAATTAAATCTTAACAAATGATAATGCAATAAATCTCTAGG TGATTTATGATGTAGTTAATTTTTATTACTGGAGGTTAATTGTTATGAAAAATGAAATAGTTGTTTT AATTACTGGATGTTCTACAGGGATTGGAAGAGAGCTTTGTAGTATATTGTTTCACAAAGGATGTACG GTTGTTGCAACAGCAAGAAATGTAGAAACTTTAAAAGATTTATCTGCGTCCTTAAGATTACCACTGG ATGTTACCCAAAAAGAGTCTATTAACAGTACAATAAATGAAGTTGTATCAAAATTTCATAAAATTGA TATTCTTATAAATAACGCAGGCTATTCAATTAGAGGAGCTTTAGAAGAAATTGATTTAAATAGTGCT AAAAGTATGTTTGATGTAAATGTATTTGGTATTATTAACATGATTCAGGCAGTTATTCCAGAAATGC GTAAAAAACAATTTGGTAAGATTATAAATATTGGCTCCATTTCAGGGAAATTTGTTCAATCCATCAA TGGAGCGTATTGTGCATCAAAATTTGCAGTTGAGGCACTAAGTGACACACTTCGTTTAGAATTACAC AGCTACAATATTCAGAGCACCGTCATTGAGCCAGGTCCCATGAAAACCAACTTTTTTAAGGCATTAG TGGATAATTCAGGCGATGTTATAAAAAATGAAAATTCTTGTTATTCACATTTTTATAAATCAGATGA TGAATATAGAAAAAAGCAAAAACAAGCTGATCCTAAAGTAGCAGCACAAGCTATTAGTGATATAATT TTGAAAAAACGACTTAATGCTCGTTATAAAGTTGCTGTTCCATTTACATATAAGATGGTTACATATT TTCCTGATTTTCTAAGAGAATACTTTATGAAAAAAAGATAG >Gene ID No. 26: RCCC02765 Contig0001_686363_687232 TAGTTGATATATAACTTTTTAGTCGTACAAATACGAAATATATTTTATCATACTTGCATGTAAAATG CTATACAGCTTATACTTCTAAAGTTTGTTTATATTAGTTCACAGGGTTTCAAAAATTGTAGTTTATA ATCACATATATTTTCGAAATTCATATATTAAATAGAAGTACTTTACAATATTGGAGGAACTACTATA TGTGTTCAAATCATATTGGATGCAAATTTCCACGCTTTTTTCCACCCCAACATCAGCCACATCAACC TGGTATTGAATATATTATGACACCTAGACCAGTTTTCGAACCACCATTATGTGCACAATATCAAACG ACAAAAAGATTATTAAACAAAGTAGCTTTAATAACAGGAGGAGACAGCGGTATTGGGCGTGCTGTAG CATGTGCTTATGCAAAAGAAGGAGCTGATATTGCCATTGTCTATCTAAATGAACATGTAGATGCAGA GGGAACAAAATCTAGAATAAAAAAATTGGGGCGAAGATGTTTAACCATTCCAATTAACATAGGAGTC GAAGAGAATAGTAAAATTATAATTCAAGAAGTTATGAATCATTTTGGTAAATTAGATATTCTTGTAA ATAATGCTGCAGTACTTTATTACAATAATTCTATAGAAGAAGTATCTAGCAAACAATTAGAATGGAC TTTTCGTATAAATGTATTTTCTTATTTCTACTTAACTAAAGCAGCTCTACCTTATATGAAACCAGGC GGTTCTATCATCAATACTTCTTCAATAGTTGCTTTTAATCCTCCTTATGGGATATCTTTAGATTATG AAGCTTCAAAAGGTGCCATTGCTAATTTCACTATAAATTTAGCCCGAAGTTTGGTTTCAAGAGGAAT ACGTGTAAATGGTGTAGCTCCAGGTGAAACCTGGACACCTTTAATTCCAGCAGGATTACCTGCAGAT AAAGTTGCCGTTTGGGGTTCAAAAACACCAATGGGAAGAGCTGCTCAACCATTTGAAATTGCTCCAG CCTATGTATTCTTAGCTTCCAATGAATCAAGCTATATGTCAGGACAAACAATCCATATGTATTCTTA A >Gene ID No. 27: RCCC03290 Contig0001_1203895_1202426 GAGTAAAAGTTGATGAGGAGAGAAAATCAGGGTCACTTCTCGAAATAAAACAAAAACTTGAAAGAAT GAAAGTTATTGAACTCAGAAATATGGCTAGAAAAATGAATTTAAGTTCATTGACTAAGAAGGACATT AAATTTGGCAAGAAAAAGCAGCTGATTAAAGCAATTTTAGAGTACTATACAAGGAGGTTAAAGTAAA TGGAAAATATAGATAGGGATTTACAATCTATACAAGATGTAAGGCGGCTTGTTGAAAAGGCAAGACA AGCTCAACAAGAATATTGTAAATTCAGTCAGGAAAAGATGAATAAAATTATTGAGCATGTAGCGGAA TCTGCTGGCTTACAAGCTGAAAGATTAGCAAAACTTGCTGTAGAAGAAACAACTTTTGGAAATTTAC CTGATAAGATAATTAAAAATAAGTTTGCTAGTGAAATAGTGTATGAAAATATAAAGGACATGAAGTT AGTAGGTATTTTAAGAGATGACAAAGATAGAAAAGTATTAGAGATAGGTTCACCTGTAGGTATTATT GCAGGGCTTGTACCATCAACTAATCCTACTTCTACTGTTATATATAAAAGTCTTATAGCTTTAAAAT CGGGAAATGCAATTGTATTTAGTCCTCATCCAAAGGCAAGACATTGCATTGCAGAAGCTATAAAGGT TGTAAGTGATGCAGCTGTTGAGGCAGGAGCACCTTTAGGAATGGTTTCCGGAATGAGTATACTTACT ATGGAAGGAACTCATGAGCTTATGAAAAACGTTGATCTCATACTAGCAACAGGTGGATCAGCTATGG TAAAGGCAGCATACAGTTCAGGAACTCCGGCTATAGGAGTTGGACCTGGAAATGGACCTGCTTTTAT TGAAAAAACAGCAAATATAAAACTTGCAGTAAAAAGAATAATGGATAGTAAAACTTTTGACAATGGG GTAATATGTGCTTCAGAACAGTCCATAGTAGTTGAAAAATGTATAAAAGATGAAGTTGTAGATGAGC TTAAACGCCAAGGAGCATACTTCTTATCTAAAGAACAATCAGAAAAAGTAGCAAAGTTTATATTGAG AGCAAATGGTACTATGAATCCTCAAATTGTAGGAAAATCAGCTCAGAAAATAGCTGAAATGGCAGGT ATAACTGTAGATCCAAATGCAAGAATATTGATTTCAGAGCAGACGACAGTTGGAAAAGATAACCCAT TTTCAAGGGAAAAGCTTACAACGATTTTAGCATTCTACTGTGAAGAAAATTGGGAAAAAGCTTGCGA GAGATGCATTGAGCTTTTAAATAATGAAGGTATAGGACATACTCTCATAATACATTCAAATAATGAA GAAATAGTAAAAGAATTTGGACTTAAAAAACCTGTATCCAGAATACTTGTAAACACGCCAGGATCAC TTGGAGGAATAGGAGCTACTACAAATCTAGTGCCTGCACTTACACTTGGATGCGGAGCAGTTGGAGG AAGTGCAACTTCTGATAATGTAGGACCTAGGAATCTTATAAATATAAGAAGAGTTGCCTATGGAGTA AAGGAAATAGAAGATATAAAAAATTTTGTAAGTAATTGTAGTGACAGAGAAACCTCACACACTGTTT TGGATATTTCTGATCAGTACATTGAACTTATAACTAAAAAAATAGCTGAAAAGCTTAGTTTGTAA >Gene ID No. 28: RCCC04101 Contig0001_2040462_2038897 ATGGTTTAGAAAAAGCTATTGAGATTTTAAGTAAGTTTAAGGTAATAGAGCTTCGAAATCTCGCTCG TAAATATAAGAACTTTGGTATCAAAGGAAGGTCCATTTCTAAAGCAGACAAGAAGTTGCTGCTTATA GAGTTCAAAAAATATTATGGGCATAATTAGCCAGCTATAAAAATTAAAATATATAAATAATAAACAA TGGAGGGAACACAATTGGAAAATTTTGATAAAGACTTACGCTCTATACAAGAAGCAAGAGATCTTGC ACGTTTAGGAAAAATTGCAGCATGTGAAATTGCTGATTATACTGAAGAACAAATTGATAAAATCCTA TGTAATATGGTTAGGGTAGCAGAGGAAAATGCAGTTTGCCTTGGTAAAATGGCTGCAGAAGAAACTG GTTTTGGAAAAGCTGAAGATAAGGCTTATAAGAACCATATGGCTGCTACTACAGTATATAATTATAT CAAGGATATGAAGACTATTGGTGTTATAAAAGAAGATAAAAGTCAAGGTGTAATTGAATTTGCTGAA CCAGTTGGTTTATTAATGGGTATTGTACCATCTACAAATCCAACATCTACTGTTATCTATAAATCAA TCATTGCAATTAAATCAAGAAATGCAATTGTATTCTCACCACACCCAGCTGCATTAAAATGTTCAAC AAAAGCAATAGAACTTATGCGTGATGCAGCAGTAGCAGCAGGAGCTCCTGCAAATGTAATTGGCGGT ATTGTTACACCATCTATACAAGCTACAAATGAACTTATGAAAGCTAAAGAAGTTGCTATGATAATTG CCACTGGAGGCCCTGGAATGGTAAAGGCTGCTTATAGTTCAGGAACACCTGCAATAGGCGTTGGTGC TGGTAACTCTCCATCTTATATAGAAAGAACTGCTGATGTTCATCAATCAGTTAAAGATATAATTGCT AGTAAGAGTTTTGACTATGGTACTATTTGTGCATCTGAGCAATCAATAATTGTTGAAGAATGCAACC ATGATGAAGTAATAGCTGAGTTGAAGAAACAAGGCGGATATTTCATGACAGCTGAAGAAACTGCAAA AGTTTGCAGTATACTTTTTAAGCCTGGTACACACAGTATGAGTGCTAAGTTTGTAGGAAGAGCTCCT CAGGTTATAGCAGCAGCTGCAGGTTTCTCAGTTCCAGAAGGAACAAAAGTTTTAGTAGGAGAACAAG GCGGAGTTGGTAATGGTTACCCTCTATCTTATGAGAAACTTACAACAGTACTTGCTTTCTATACAGT TAAAGATTGGCATGAAGCATGTGATCTTAGTATAAGATTACTTCAAAATGGTCTTGGACATACTATG AACATTCATACAAATGACAGAGACTTAGTAATGAAGTTTGCTAAAAAACCAGCATCCCGTATATTAG TTAATACTGGTGGAAGCCAAGGAGGTACTGGTGCAAGCACAGGATTAGCACCTGCATTTACATTAGG TTGTGGTACATGGGGAGGAAGCTCTGTTTCCGAAAATGTTACTCCATTACATTTAATCAATATAAAG AGAGTTGCATATGGTCTTAAAGATTGTTCTACATTAGCTGCAGATGATACAACTTTCAATCATCCTG AACTTTGTGGAAGCAAAAATGACTTAGGATGCTGTGCTACAAGCCCTGCAGAATTTGCAGCAAATAG CAATTGTGCTAGCACTGCTGCGGATACTACTGATAATGATAAACTTGCTAGACTCGTAAGTGAATTA GTAGCTGCAATGAAGGGAGCTAACTAA >Gene ID No. 29: RCCC04114 Contig0001_2051568_2050075 AAGCTGTAACAGATATGGGCGCTGAAGTTTATAGTTCAGTTGTTATTGCAAGTCCACATCCGGATCT TCAGAAAATCACCAAACGTTATACAATTGAAAATTTACTTCCTTAATATGTGGATGATATGATACCA CCACATAAAATGAAAAAGTACAGAAGTACAGTACTTAGTTAGTAAAAATGAAAGGGAGAGTTAGAAA TGAATATTATTGATAATGATTTGCTCTCCATCCAAGAATCCCGAATCCTTGTGGAAAATGCTGCACG AGCACAAAAAATGTTAGCAACTTTTCCGCAAGAAAGTTAGATGAGATTGTTGAACGTATGGCTGAAG AAATCGGAAAACATACCCGAGAGCTTGCTGTAATGTCACAGGATGAAACTGGTTATGGAAAATGGCA GGATAAATGCATCAAAAACCGATTTGCCTGTGAATATTTGCCAGCTAAGCTTAGAGGAATGCGATGT GTAGGTATTATTAACGAAAATGGTCAGGATAAGACCATGGATGTAGGTGTACCTATGGGTGTAATTA TTGCATTATGTCCTGCAACTAGTCCGGTTTCTACTACCATATATAAGGCATTAATTGCAATTAAGTC TGGTAATGCAATTATCTTTTCTCCACATCCTAGAGCAAAGGAGACAATTTGTAAGGCGCTTGACATC ATGATTCGTGCAOCTGAAGGATATGGGCTGCCAGAAGGAGCTCTTGCATACTTACATACTGTGACGC CTAGTGGAACAATCGAATTGATGAACCATGAGGCGACTTCTTTGATTATGAATACAGGCGTTCCCGG GATGCTTAAAGCGTCATATAGATCTGGAAAACCTGTGATCTATGGAGGAACTGGTAATGGACCAGCA TTTATTGAACGTACAGCTGACATCAAGCAGGCGGTAAGAGATATTATTGCTAGTAAGACCTTTGATA ACGGAATAGTACCATCATCTGAACAATCTATTGTTGTAGATAGCTGTGTTGCATCTGATGTTAAACG TGAGTTGCAAAATAGTGGTGCATATTTCATGACAGAGGAGGAAGCACAAAAACTGGGTTCTCTCTTT TTCCGTTCTGATGGTAGTATGGATTCAGAAATGGTTGGCAAATCCGCACAGAGATTGGCTAAGAAAG CAGGTTTCAGTATTCCTGAAAGTAGCACAGTGCTAATTTCAGAGCAGAAATATGTTTCCCAAGATAA TCCTTATTCCAAGGAGAAACTTTGTCCGGTACTAGCTTACTACATTGAAGATGATTGGATGCATGCA TGTGAAAAGTGTATTGAGCTGCTATTAAGTGAGAGACATGGTCACACTCTTGTTATACATTCAAAAG ACGAAGATGTAATTCGCCAGTTTGCATTAAAAAAACCTGTAGGCAGGATACTTGTTAATACGCCTGC TTCCTTTGGTAGTATGGGTGCTACAAGTAATTTATTTCCTGCTTTAACTTTAGGTAGTGGATCGGCA GGTAAAGGTATTACCTCCGATAATGTTTCACCAATGAATCTTATTTACGTCCGTAAAGTCGGATATG GCGTACGGAATGTAGAAGAGATTATTAATACTAATGGATTGTTTACAGAAGAAAAAAGTGATTTGAG TGGTATGACAAAGCAGTCAGACTATAATCCAGAGGATATACAAATGTTGCAGCATATTTTGAAAAAA GCTATGGAAAAAATTAAATAG SEQ ID NO. 3 >Gene ID No. 44: RCCC01825 Contig0001_3489615_3490466 ATGAATACTGTAATTATGATTTTAGTTGTAATGACTGTTATAGGTCTTATATTGGACTTGTTTTAGC CTATGTAAATAAAAGATTTGCAATGGAAGTAAATCCACTTGTGGACTTAGTAGAAGATGTACTTCCA AAAGGCCAATGTGGAGGGTGTGGATTTGCAGGATGTAAAGCTTATGCAGAAGCTGTTGTTTTAGATG AGAGTGTACCTCCAAATCTTTGTGTACCTGGAAAAGCAGCAGTTGCAGAACAGGTGGCAAAGTTAAC GGGTAAATCTGCTCCACCTATTGAACCTAGAGTTGCACATGTAAGATGTGGTGGAGATTGTACAAAG GCAGTTAAAAATTTTGAATATGAAGGTATACATGATTGTGTAGCTGCAAATTTACTTGAAGGTGGAC CTAAAGCTTGTAAATATGGATGTCTGGGATTTGGGACATGTGTAAAGAGCTGTCCTTTTGGAGCTAT GGCAATGGGTTCAAATGGACTTCCAATAATTGATACAGATATATGTACAGGTTGTGGTACCTGTGTA AGCGCGTGCCCAAAACAGGTACTTGGATTTAGGCCTGTAGGTTCTAAAGTAATGGTTAATTGTAATT CTAAAAATAAAGGTGGAGCTGTACGTAAGGCATGTAGTGTAGGATGTCTTGGATGTGGATTGTGTGC TAAAAATTGTCCAAATGATGCCATTAAAGTAGAGAACAATCTAGCAGTAGTAGACCAAAGTATTTGT GCGTCATGTAGTGAAGCTACCTGTCTTGCTAAATGTCCTACAGGAGCTATTAAGGCTATTGTAAGCG GTACAGACTTACAACAGCAGAGCAAGAATGAAGCTGCTGCAAATTCATAA >Gene ID No. 45: RCCC01826 Contig0001_3489018_3489596 ATGGCATCTTACCTTACTCTTTTTATAAGTGCAGTAGTTGTAAATAACTATGTTTTAACAAGGTTTT TGGGACTTTGTATATTCTTTGGTGTTTCTAAGAATTTAAATGCTTCTGTAGGTATGGGTATGGCTGT TACTTCTGTTATTACTATGAGTTCAATATTGGCCTGGGTAGTATATCATTTTGTACTTATACCATTT AATTTAACTTTCTTGAAGACAGTAGTTTTTGTACTTCTTATTGCTAGTTTTGTACAGCTTTTGGAGA CTATTATTAAAAAGCAGGCACCAGCCCTATATAATATGTGGGGAATATACCTTCTTTTAATAGCTAC AAACTGTATAGTACTTGCTGTACCTATATTAAATGCTGATTCTAACTTTAATTTTTTACAGAGTGTT GTTAATGCGATAGGATCTGGGCTAGGCTTTGCTATGGCTATAATTTTGATGGCAAGCCTTAGAGAAA AATTGAGATTAGCAGATGTACCTAAACCTTTAGAAGGTCTTGGAGTAGCTTTTATTTTAGCAGGAAT GTTAGCCCTAGCTTTCCTTGGTTTTTCAGGTATGATTTCTATGTAG >Gene ID No. 46: RCCC01827 Contig0001_3488377_3489015 ATGAAGAATTTGTGGAATATATTTAAAAAAGGATTGATTGCAGAAAACCCCATATTCGTACTTGCAC TTAGTTTGTGTCCAGCACTGGCAACTACAAGTACAGCTGTAAATGGATTTACCATGGGGCTCTGCGT GCTATTTGTTATAACTTGTAATAATACTGTGGTTTCTATAATTAAGAATTTTGTAAATCCTAAGGTA CGTGTACCTGTATATATCACTTGTATAGCAACTATAGTTACAGTAGTGGAACTTGTTATGCAGGCTT ATGCACCTCTATTATATAAGCAATTGGGAATTTATTTAGCATTGGTAGTTGTATTTGCTATAATACT TGCCCGTGCAGAGACATTTGCATCTAAAAATCCTGTAGTTCCTTCTTTCTTTGATGGACTTGGAATG GGATGTGGATTTACTTTGGCACTTACTATAATAGGAATGATACGTGAATTATTTGGATCTGGAGCTA TATTTGGTTTTAATGTATTTGGGGCTTCATATAATCCAGCTTTGATTATGATACTTCCACCTGGAGG ATTCATACTTATAGGATATTTAGTTGCTATAGTAAAAGTTTATAACCAACATATGGAGAAAATTAAA ATGCAAAAATTAGAACAAGCAAATGGAGGTGAAGCATAA >Gene ID No. 47: RCCC01828 Contig0001_3487817_3488371 ATGGCTAAAGATAAAGATCAAAATAGTATTTTTGCAATTACTAAGAACTTAACCATTACGTGTTTTA TATCTGGAATTATAATAGCTGCGGTTTATTATGTAACATCACCAGTGGCAGCACAAAAACAAGTTCA AATACAAAATGATACCATGAAAGTTTTAGTCAATGATGCTGATAAATTTAATAAAGTAAATGGTAAA AAGGATTGGTATGCAGCTCAAAAAGGAAACAAGACAATTGCATATGTTGTACCTGCAGAGAGTAAAG GTTACGGTGGAGCTATAGAGCTATTGGTAGCTGTTACTCCAGATGGAAAAGTAATAGATTTCAGCAT TGTATCTCATAATGAAACTCCAGGACTTGGAGCAAATGCTTCAAAGGATTCTTTTAGGGGACAGTTT AAGGATAAAAAGGCGGATGCCTTAACAGTTGTAAAAGATAAGTCTAACACTAAAAACATTCAAGCTA TGACAGGAGCTACAATTACGTCAAAAGCTGTAACTAAAGGAGTTAAAGAAGCTGTTGGGCAAGTTAC TACGTTTACGGGAGGTAAGTAA >Gene ID No. 48: RCCC01829 Contig0001_3486815_3487807 ATGGCGGAAGCACAGATAAAGAAAAATATTTTTACTATTTCGTCATCACCTCATGTTCGTTGTGATG AATCTGTTTCTAAGATAATGTGGAGTGTCTGTTTAGCACTAACTCCAGCTGCGATTTTTGGCGTATT TAATTTTGGAATTCATGCTTTAGAAGTAATTATAACAGGAATTATAGCTGCTGTAGTTACAGAGTAC CTTGTAGAAAAAGTTAGAAATAAACCTATAACTATTACAGATGGAAGTGCTTTTTTAACAGGACTTT TACTTTCTATGTGTTTACCTCCTTGATATTCCACCTTATATGGTAGCTATAGGATCTTTTATAGCAA TAGCAATAGCTAAACATTCTATGGGAGGACTTGGTCAGAACATATTTAATCCAGCTCATATTGGAAG GGCTGCACTAATGGTTTCCTGGCCTGTAGCAATGACAACATGGTCAAAATTAAGTGCCAGTGGTGTA GATGCTGTAACCACAGCAACTCCTCTTGGAATTTTAAAGCTTCAAGGTTATTCAAAATTACTTGAGA CTTTTGGAGGTCAAGGTGCACTTTACAAGGCAATGTTCTTAGGTACTAGAAATGGAAGTATAGGAGA AACTTCTACAATATTACTTGTTTTAGGTGGACTTTATCTAATATATAAAAAATATATTAACTGGCAG ATTCCAGTAGTAATGATCGGTACTGTAGGAATACTTACCTGGGCTTTTGGAGGAACTACGGGACTTT TTACAGGAGATCCTGTATTTCATATGATGGCAGGCGGACTTGTAATTGGAGCTTTCTTTATGGCTAC TGATATGGTAACAATTCCTATGACTATTAAAGGACAGGTTATTTTTGCATTAGGTGCAGGTGCGCTT ACATCACTTATAAGATTAAAAGGTGGTTATCCAGAAGGCGTATGTTATTCAATATTACTTATGAATG CAGTTACTCCTCTAATAGATAAGTTTACACAGCCAGTTAAATTTGGGACAAGGAGGTAA >Gene ID No. 49: RCCC01830 Contig0001_3485423_3486793 AACTTTAATTAATAAGAGTATCTTTTAAAGTTAACTGACATTTAATAGATAAATTGTCATTATATAT TATTTCCTATAGTATATAATTTTATAACGGATTATGGAAAATTCTATAATCTGTTATAAAAATTATG TTTATATTTATTTTGCAGTTTCGTTTATATACATGCTGTAAAAATTATTGAAAGAGGTGTTTAAGAG TGTTAAAAAGTTTTCGAGGTGGAGTACACCCGGATGATAGCAAAAAGTACACAGCTAATAAACCTAT AGAAATAGCACCTATACCAGACAAGGTGTTTATTCCCGTTAGACAGCATATAGGTGCTCCTACATCT CCTGTAGTACAAAAAGGAGATGAGGTAAAAAAGGGACAACTTATTGCGAAGAGTGATGCTTTTGTTT CAGCCAATATATATGCATCTACTTCTGGAAAGGTTGTAGATATAGGAGATTACCCACATCCTGGTTT TGGAAAGTGTCAAGCTATAGTTATTGAAAAAGATGGAAAAGATGAGTGGGTAGAAGGAATACCAACT TCACGTAATTGGAAAGAGCTAAGTGCAAAAGAAATGCTTGGAATAATAAGAGAAGCAGGCATTGTAG GAATGGGAGGCGCAACTTTTCCTGTTCATGTTAAACTTGCACCACCACCAGATAAAAAAGTAGATGT TTTTATTTTGAATGGTGCTGAGTGTGAACCTTATTTAACTGCAGATTATAGGTCCATGTTGGAAAAA TCAGATAAGGTAGTTGCTGGAGTTCAAATAATTATGAAAATCCTCAATGTGGAAAAAGCATTTGTAG GTATTGAAGATAATAAACCAGATGCCATAGAAGCTATGAAAAAAGCTTTTGAAGGTACAAAAGTACA AGTAGTAGGCCTTCCTACTAAGTATCCTCAGGGTGCTGAAAAAATGCTTATAAATGTTTTGACAGGT AGAGAAGTTCCATCAGGTGGATTGCCTGCAGATGTAGGTGCGGTTGTTCAAAATGTAGGTACATGCA TAGCAATAAGCGATGCAGTGGAGAGAGGAATTCCACTTATACAGAGAGTTACAACTATAAGTGGAGG TGCTATTAAAGAGCCTAAAAATATATTAGTTAGAATTGGAACTACATTTAAAGATGCCATTGATTTT TGTGGAGGATTTAAGGAAGAACCAGTTAAAATAATTTCAGGTGGACCTATGATGGGATTTGCCCAAT CAAATTTGGATATTCCAATAATGAAGGGTTCATCAGGAATACTTGGTTTAACTAAAAATGATGTAAA TGATGGAAAAGAATCTTCTTGCATTAGATGTGGCAGATGTCTAAAAGCCTGTCCTATGCACTTGAAT CCAAGTATGTTAAGTATTCTTGGACAAAAAGATTTATATCAAGAAGCTAAGGAAGAATATAATCTTT TGGACTGCGTAGAATGCGGCAGCTGTGTATATACATGTCCTGCTAAACGAAGAATTGTACAGTATAT TAGATATTTAAAATCAGAAAATAGAGCTGCAGGGGCAAGGGAAAAGGCTAAAGCAGAAAAGGCTAAA GAAAAGAAAGAAAAAGAAGAGGTCTTAAAATAA

In order to create the minimum sets found in SEQ ID NOS. 1-3, the genomes of C. ragsdahlii, C. ljungdahlii, C. autoethanogenum, and C. carboxydivorans were fully sequenced. A sequence-level analysis and comparison was performed with a cutoff score of P=1×10⁻²⁰, and function was established for the genes present. At such a level of identity, one of skill in the art recognizes that there is virtually no probability that the alignment is the result of chance. Therefore, the minimum sets found in SEQ ID NOS. 1-3 represent fully conserved sets.

At the present time, screening potential microorganisms for high ethanol titer production capability is an extended and daunting task. Function maybe established, but often through costly and time-consuming bench assays. Using several embodiments of the present invention, however, a prospective microorganism may be prescreened for function, and such function may be confirmed.

To practice such embodiments, a sample is first collected that may contain anaerobic solventogenic microorganisms. The sample is amplified, and then undergoes an isolation and enrichment process that may comprise any number of steps according to techniques well-known in the art. Enrichment and isolation may include, but are not limited to, confirmation of autotrophic function, screening for syngas utilization, confirmation of the presence of an Acetyl-CoA reductase gene, or confirmation of the presence of a CODH/ACS operon. After isolating and enriching any microorganisms of interest, the microorganisms are plated for further phenotypic metagenomic analysis.

The narrowed microorganisms may then undergo a polymerase chain reaction with a sample of at least one degenerate primer that will bind to one of the essential genes for solventogenesis function. A kit with primers which will bind to all sixty-four essential metabolic genes may also be utilized. A separation is then performed based on size; in a preferred embodiment the product of the PCR will be electrophoreted. The results are then read to determine the presence or absence of each essential gene of interest. If one of the essential genes listed in Table 1 is absent, the metabolic pathway may not produce high titers of product.

In a further embodiment, to confirm de novo high ethanologenic function, the genome of the potentially ethanologenic microorganism is sequenced. A comparison is performed between the genes contained in the prospective microorganism's genome and the gene sequences of the minimum set with a cutoff score of P=1×10⁻²⁰. If the genome of the prospective microorganism comprises at least the minimum set, then ethanologenic function via the Wood-Ljungdahl pathway is preserved, and the microorganism is likely to produce high ethanol titers when fermented with syngas.

Claims

1. An isolated and purified polynucleotide encoding a polypeptide sequence with a P value of 1×10−20 or smaller when compared to SEQ ID NO. 1.

2. An isolated and purified polynucleotide encoding a polypeptide sequence with a P value of 1×10−20 or smaller when compared to the sequence of SEQ ID NO. 2.

3. An isolated and purified polynucleotide encoding a polypeptide sequence with a P value of 1×10−20 or smaller when compared to the sequence of SEQ ID NO. 3.

4. A method of producing ethanol comprising: isolating and purifying anaerobic, ethanologenic microorganisms carrying the polynucleotide of claim 1; fermenting syngas with said microorganisms in a fermentation bioreactor.

5. A method of producing ethanol comprising: isolating and purifying anaerobic, ethanologenic microorganisms carrying the polynucleotide of claim 2; fermenting syngas with said microorganisms in a fermentation bioreactor.

6. A method of producing ethanol comprising: isolating and purifying anaerobic, ethanologenic microorganisms carrying the polynucleotide of claim 3; fermenting syngas with said microorganisms in a fermentation bioreactor.

7. A method of confirming high titer autotrophic solventogenesis function of a potentially commercially viable microorganism, said method comprising: sequencing the genome of said potentially commercially viable microorganism; comparing a resulting sequence of the genome of the microorganism to SEQ ID NO. 1.

8. A method of prescreening natural isolates with suspected autotrophic solventogenesis function for high ethanol titer potential, said method comprising: isolating and enriching a sample containing said natural isolates; subjecting said sample to a polymerase chain reaction using at least one set of degenerate primers capable of hybridizing to one or more of the genes of claim 1; separating the amplified product of the polymerase chain reaction based on size; and determining the presence of said genes based on the results of said separation.