Ayham

37 models • 1 total models in database

Sort by:

bert_bert_summarization_cnn_dailymail

xlnet_distilgpt2_summarization_cnn_dailymail

bert_roberta_summarization_cnn_dailymail

albert_gpt2_summarization_xsum

ernie_gpt2_summarization_cnn_dailymail

roberta_gpt2_summarization_cnn_dailymail

albert_distilgpt2_summarization_cnn_dailymail

albert_bert_summarization_cnn_dailymail

albert_gpt2_Full_summarization_cnndm

albert_gpt2_summarization_cnndm

distilbert_bert_summarization_cnn_dailymail

roberta_distilgpt2_summarization_cnn_dailymail

roberta_roberta_summarization_cnn_dailymail

xlnet_roberta_summarization_cnn_dailymail

distilbert_distilgpt2_summarization_cnn_dailymail

distilbert_gpt2_summarization_cnndm

distilbert_gpt2_summarization_xsum

distilbert_roberta_summarization_cnn_dailymail

roberta_bert_summarization_cnn_dailymail

roberta_gpt2_summarization_xsum

ernie_roberta_summarization_cnn_dailymail

roberta_ernie_summarization_cnn_dailymail

albert_ernie_50beam_summarization_cnn_dailymail

distilgpt2_summarization_cnndm

license:apache-2.0

Roberta Gpt2 New Max64 Summarization Cnndm

This model is a fine-tuned version of [](https://huggingface.co/) on the cnndailymail dataset. The following hyperparameters were used during training: - learningrate: 5e-05 - trainbatchsize: 8 - evalbatchsize: 8 - seed: 42 - optimizer: Adam with betas=(0.9,0.999) and epsilon=1e-08 - lrschedulertype: linear - lrschedulerwarmupsteps: 2000 - numepochs: 3.0 - mixedprecisiontraining: Native AMP - Transformers 4.12.0.dev0 - Pytorch 1.10.0+cu111 - Datasets 1.17.0 - Tokenizers 0.10.3

bert_distilgpt2_summarization_cnn_dailymail

albert_roberta_summarization_cnn_dailymail

bert_gpt2_summarization_cnndm_new

bert_gpt2_summarization_xsum

robertagpt2_cnn

xlmroberta_large_gpt2_summarization_cnndm

xlnet_bert_summarization_cnn_dailymail

xlnet_gpt_xsum

ernie_bert_summarization_cnn_dailymail

ernie_ernie_summarization_cnn_dailymail

roberta_roberta_summarization_xsum

gpt2_summarization_cnndm