zhangtaolab

77 models • 1 total models in database

Sort by:

plant-dnamodernbert-BPE

The plant DNA large language models (LLMs) contain a series of foundation models based on different model architectures, which are pre-trained on various plant reference genomes. All the models have a comparable model size between 90 MB and 150 MB, BPE tokenizer is used for tokenization and 8000 tokens are included in the vocabulary. - Repository: Plant DNA LLMs - Manuscript: PDLLMs: A group of tailored DNA large language models for analyzing plant genomes The model is trained based on the ModernBERT model with modified tokenizer specific for DNA sequence. Here is a simple code for inference (Note that Mamba model requires NVIDIA GPU for inference): Training data We use MaskedLM method to pre-train the model, the tokenized sequence have a maximum length of 1024. Detailed training procedure can be found in our manuscript. Training used FlashAttention2 to accelerate the process. Hardware Model was pre-trained on a NVIDIA RTX4090 GPU (24 GB).

zhangtaolab

plant-dnamamba-singlebase-promoter

dnabert2-promoter

plant-dnabert-BPE

plant-dnamodernbert-BPE

plant-dnagpt-6mer-promoter

plant-dnamamba-singlebase-promoter_strength_leaf

plant-dnagpt-BPE

plant-dnagpt-6mer

plant-dnagpt-6mer-conservation

plant-dnagpt-6mer-H3K27me3

plant-dnagpt-6mer-open_chromatin

plant-dnagpt-6mer-H3K4me3

plant-dnagpt-6mer-H3K27ac

plant-dnamamba-BPE

plant-dnamamba-singlebase

plant-dnagpt-6mer-lncRNAs

plant-dnamamba-BPE-promoter

plant-dnagemma-BPE

plant-nucleotide-transformer-singlebase

nucleotide-transformer-v2-100m-open_chromatin

plant-dnabert-6mer-promoter

Maize_GxE_Mamba2-90M-2mer

plant-nucleotide-transformer-BPE

plant-dnagemma-BPE-open_chromatin

plant-dnabert-BPE-H3K27ac

plant-nucleotide-transformer-BPE-lncRNAs

plant-dnagemma-BPE-lncRNAs

plant-dnagpt-BPE-promoter

plant-dnabert-BPE-open_chromatin

plant-dnabert-BPE-H3K27me3

plant-dnamamba-BPE-H3K4me3

plant-dnamamba-BPE-lncRNAs

plant-dnamamba-2mer-promoter

plant-dnamamba-3mer-H3K27me3

plant-dnamamba-6mer-H3K27ac

plant-dnamamba-6mer-conservation

plant-dnagemma-6mer-H3K27me3

Agront 1b Conservation

plant-dnagpt-BPE-H3K27ac

plant-dnagemma-BPE-promoter_strength_leaf

plant-dnamamba-BPE-open_chromatin

plant-dnabert-BPE-promoter

nucleotide-transformer-v2-100m-promoter

plant-nucleotide-transformer-BPE-H3K27me3

plant-dnamamba-BPE-H3K27me3

dnabert2-H3K27me3

plant-nucleotide-transformer-BPE-H3K4me3

plant-dnabert-BPE-lncRNAs

plant-dnabert-BPE-promoter_strength_leaf

plant-nucleotide-transformer-BPE-promoter_strength_leaf

plant-dnamamba-BPE-promoter_strength_leaf

plant-dnagpt-BPE-promoter_strength_protoplast

plant-dnagemma-BPE-promoter_strength_protoplast

plant-dnamamba-BPE-promoter_strength_protoplast

agront-1b-promoter_strength_protoplast

plant-dnamamba-2mer

plant-dnamamba-2mer-LncRNAs

plant-dnamamba-3mer-open_chromatin

plant-dnamamba-4mer-H3K27me3

plant-dnamamba-4mer-open_chromatin

plant-dnamamba-5mer-H3K27me3

plant-dnamamba-6mer-H3K27me3

plant-dnamamba-6mer-open_chromatin

plant-dnamamba-6mer-promoter_strength_leaf

plant-dnamamba-6mer-promoter_strength_protoplast

plant-dnagemma-6mer

plant-dnagemma-singlebase-H3K27me3

plant-dnabert-singlebase-promoter

plant-dnabert-singlebase-lncRNAs

plant-dnabert-6mer-H3K27me3

plant-dnabert-6mer-lncRNAs

plant-nucleotide-transformer-singlebase-H3K4me3

plant-nucleotide-transformer-singlebase-lncRNAs

plant-nucleotide-transformer-singlebase-promoter_strength_leaf

plant-nucleotide-transformer-singlebase-conservation

dnabert2-conservation

agront-1b-lncRNAs