Related papers: Gemma 3 Technical Report

Gemma 2: Improving Open Language Models at a Practical Size

In this work, we introduce Gemma 2, a new addition to the Gemma family of lightweight, state-of-the-art open models, ranging in scale from 2 billion to 27 billion parameters. In this new version, we apply several known technical…

Computation and Language · Computer Science 2024-10-03 Gemma Team , Morgane Riviere , Shreya Pathak , Pier Giuseppe Sessa , Cassidy Hardin , Surya Bhupatiraju , Léonard Hussenot , Thomas Mesnard , Bobak Shahriari , Alexandre Ramé , Johan Ferret , Peter Liu , Pouya Tafti , Abe Friesen , Michelle Casbon , Sabela Ramos , Ravin Kumar , Charline Le Lan , Sammy Jerome , Anton Tsitsulin , Nino Vieillard , Piotr Stanczyk , Sertan Girgin , Nikola Momchev , Matt Hoffman , Shantanu Thakoor , Jean-Bastien Grill , Behnam Neyshabur , Olivier Bachem , Alanna Walton , Aliaksei Severyn , Alicia Parrish , Aliya Ahmad , Allen Hutchison , Alvin Abdagic , Amanda Carl , Amy Shen , Andy Brock , Andy Coenen , Anthony Laforge , Antonia Paterson , Ben Bastian , Bilal Piot , Bo Wu , Brandon Royal , Charlie Chen , Chintu Kumar , Chris Perry , Chris Welty , Christopher A. Choquette-Choo , Danila Sinopalnikov , David Weinberger , Dimple Vijaykumar , Dominika Rogozińska , Dustin Herbison , Elisa Bandy , Emma Wang , Eric Noland , Erica Moreira , Evan Senter , Evgenii Eltyshev , Francesco Visin , Gabriel Rasskin , Gary Wei , Glenn Cameron , Gus Martins , Hadi Hashemi , Hanna Klimczak-Plucińska , Harleen Batra , Harsh Dhand , Ivan Nardini , Jacinda Mein , Jack Zhou , James Svensson , Jeff Stanway , Jetha Chan , Jin Peng Zhou , Joana Carrasqueira , Joana Iljazi , Jocelyn Becker , Joe Fernandez , Joost van Amersfoort , Josh Gordon , Josh Lipschultz , Josh Newlan , Ju-yeong Ji , Kareem Mohamed , Kartikeya Badola , Kat Black , Katie Millican , Keelin McDonell , Kelvin Nguyen , Kiranbir Sodhia , Kish Greene , Lars Lowe Sjoesund , Lauren Usui , Laurent Sifre , Lena Heuermann , Leticia Lago , Lilly McNealus , Livio Baldini Soares , Logan Kilpatrick , Lucas Dixon , Luciano Martins , Machel Reid , Manvinder Singh , Mark Iverson , Martin Görner , Mat Velloso , Mateo Wirth , Matt Davidow , Matt Miller , Matthew Rahtz , Matthew Watson , Meg Risdal , Mehran Kazemi , Michael Moynihan , Ming Zhang , Minsuk Kahng , Minwoo Park , Mofi Rahman , Mohit Khatwani , Natalie Dao , Nenshad Bardoliwalla , Nesh Devanathan , Neta Dumai , Nilay Chauhan , Oscar Wahltinez , Pankil Botarda , Parker Barnes , Paul Barham , Paul Michel , Pengchong Jin , Petko Georgiev , Phil Culliton , Pradeep Kuppala , Ramona Comanescu , Ramona Merhej , Reena Jana , Reza Ardeshir Rokni , Rishabh Agarwal , Ryan Mullins , Samaneh Saadat , Sara Mc Carthy , Sarah Cogan , Sarah Perrin , Sébastien M. R. Arnold , Sebastian Krause , Shengyang Dai , Shruti Garg , Shruti Sheth , Sue Ronstrom , Susan Chan , Timothy Jordan , Ting Yu , Tom Eccles , Tom Hennigan , Tomas Kocisky , Tulsee Doshi , Vihan Jain , Vikas Yadav , Vilobh Meshram , Vishal Dharmadhikari , Warren Barkley , Wei Wei , Wenming Ye , Woohyun Han , Woosuk Kwon , Xiang Xu , Zhe Shen , Zhitao Gong , Zichuan Wei , Victor Cotruta , Phoebe Kirk , Anand Rao , Minh Giang , Ludovic Peran , Tris Warkentin , Eli Collins , Joelle Barral , Zoubin Ghahramani , Raia Hadsell , D. Sculley , Jeanine Banks , Anca Dragan , Slav Petrov , Oriol Vinyals , Jeff Dean , Demis Hassabis , Koray Kavukcuoglu , Clement Farabet , Elena Buchatskaya , Sebastian Borgeaud , Noah Fiedel , Armand Joulin , Kathleen Kenealy , Robert Dadashi , Alek Andreev

EmbeddingGemma: Powerful and Lightweight Text Representations

We introduce EmbeddingGemma, a new lightweight, open text embedding model based on the Gemma 3 language model family. Our innovative training recipe strategically captures knowledge from larger models via encoder-decoder initialization and…

Computation and Language · Computer Science 2025-11-04 Henrique Schechter Vera , Sahil Dua , Biao Zhang , Daniel Salz , Ryan Mullins , Sindhu Raghuram Panyam , Sara Smoot , Iftekhar Naim , Joe Zou , Feiyang Chen , Daniel Cer , Alice Lisak , Min Choi , Lucas Gonzalez , Omar Sanseviero , Glenn Cameron , Ian Ballantyne , Kat Black , Kaifeng Chen , Weiyi Wang , Zhe Li , Gus Martins , Jinhyuk Lee , Mark Sherwood , Juyeong Ji , Renjie Wu , Jingxiao Zheng , Jyotinder Singh , Abheesht Sharma , Divyashree Sreepathihalli , Aashi Jain , Adham Elarabawy , AJ Co , Andreas Doumanoglou , Babak Samari , Ben Hora , Brian Potetz , Dahun Kim , Enrique Alfonseca , Fedor Moiseev , Feng Han , Frank Palma Gomez , Gustavo Hernández Ábrego , Hesen Zhang , Hui Hui , Jay Han , Karan Gill , Ke Chen , Koert Chen , Madhuri Shanbhogue , Michael Boratko , Paul Suganthan , Sai Meher Karthik Duddu , Sandeep Mariserla , Setareh Ariafar , Shanfeng Zhang , Shijie Zhang , Simon Baumgartner , Sonam Goenka , Steve Qiu , Tanmaya Dabral , Trevor Walker , Vikram Rao , Waleed Khawaja , Wenlei Zhou , Xiaoqi Ren , Ye Xia , Yichang Chen , Yi-Ting Chen , Zhe Dong , Zhongli Ding , Francesco Visin , Gaël Liu , Jiageng Zhang , Kathleen Kenealy , Michelle Casbon , Ravin Kumar , Thomas Mesnard , Zach Gleicher , Cormac Brick , Olivier Lacombe , Adam Roberts , Qin Yin , Yunhsuan Sung , Raphael Hoffmann , Tris Warkentin , Armand Joulin , Tom Duerig , Mojtaba Seyedhosseini

TranslateGemma Technical Report

We present TranslateGemma, a suite of open machine translation models based on the Gemma 3 foundation models. To enhance the inherent multilingual capabilities of Gemma 3 for the translation task, we employ a two-stage fine-tuning process.…

Computation and Language · Computer Science 2026-01-21 Mara Finkelstein , Isaac Caswell , Tobias Domhan , Jan-Thorsten Peter , Juraj Juraska , Parker Riley , Daniel Deutsch , Geza Kovacs , Cole Dilanni , Colin Cherry , Eleftheria Briakou , Elizabeth Nielsen , Jiaming Luo , Kat Black , Ryan Mullins , Sweta Agrawal , Wenda Xu , Erin Kats , Stephane Jaskiewicz , Markus Freitag , David Vilar

Gemini 1.5: Unlocking multimodal understanding across millions of tokens of context

In this report, we introduce the Gemini 1.5 family of models, representing the next generation of highly compute-efficient multimodal models capable of recalling and reasoning over fine-grained information from millions of tokens of…

Computation and Language · Computer Science 2024-12-17 Gemini Team , Petko Georgiev , Ving Ian Lei , Ryan Burnell , Libin Bai , Anmol Gulati , Garrett Tanzer , Damien Vincent , Zhufeng Pan , Shibo Wang , Soroosh Mariooryad , Yifan Ding , Xinyang Geng , Fred Alcober , Roy Frostig , Mark Omernick , Lexi Walker , Cosmin Paduraru , Christina Sorokin , Andrea Tacchetti , Colin Gaffney , Samira Daruki , Olcan Sercinoglu , Zach Gleicher , Juliette Love , Paul Voigtlaender , Rohan Jain , Gabriela Surita , Kareem Mohamed , Rory Blevins , Junwhan Ahn , Tao Zhu , Kornraphop Kawintiranon , Orhan Firat , Yiming Gu , Yujing Zhang , Matthew Rahtz , Manaal Faruqui , Natalie Clay , Justin Gilmer , JD Co-Reyes , Ivo Penchev , Rui Zhu , Nobuyuki Morioka , Kevin Hui , Krishna Haridasan , Victor Campos , Mahdis Mahdieh , Mandy Guo , Samer Hassan , Kevin Kilgour , Arpi Vezer , Heng-Tze Cheng , Raoul de Liedekerke , Siddharth Goyal , Paul Barham , DJ Strouse , Seb Noury , Jonas Adler , Mukund Sundararajan , Sharad Vikram , Dmitry Lepikhin , Michela Paganini , Xavier Garcia , Fan Yang , Dasha Valter , Maja Trebacz , Kiran Vodrahalli , Chulayuth Asawaroengchai , Roman Ring , Norbert Kalb , Livio Baldini Soares , Siddhartha Brahma , David Steiner , Tianhe Yu , Fabian Mentzer , Antoine He , Lucas Gonzalez , Bibo Xu , Raphael Lopez Kaufman , Laurent El Shafey , Junhyuk Oh , Tom Hennigan , George van den Driessche , Seth Odoom , Mario Lucic , Becca Roelofs , Sid Lall , Amit Marathe , Betty Chan , Santiago Ontanon , Luheng He , Denis Teplyashin , Jonathan Lai , Phil Crone , Bogdan Damoc , Lewis Ho , Sebastian Riedel , Karel Lenc , Chih-Kuan Yeh , Aakanksha Chowdhery , Yang Xu , Mehran Kazemi , Ehsan Amid , Anastasia Petrushkina , Kevin Swersky , Ali Khodaei , Gowoon Chen , Chris Larkin , Mario Pinto , Geng Yan , Adria Puigdomenech Badia , Piyush Patil , Steven Hansen , Dave Orr , Sebastien M. R. Arnold , Jordan Grimstad , Andrew Dai , Sholto Douglas , Rishika Sinha , Vikas Yadav , Xi Chen , Elena Gribovskaya , Jacob Austin , Jeffrey Zhao , Kaushal Patel , Paul Komarek , Sophia Austin , Sebastian Borgeaud , Linda Friso , Abhimanyu Goyal , Ben Caine , Kris Cao , Da-Woon Chung , Matthew Lamm , Gabe Barth-Maron , Thais Kagohara , Kate Olszewska , Mia Chen , Kaushik Shivakumar , Rishabh Agarwal , Harshal Godhia , Ravi Rajwar , Javier Snaider , Xerxes Dotiwalla , Yuan Liu , Aditya Barua , Victor Ungureanu , Yuan Zhang , Bat-Orgil Batsaikhan , Mateo Wirth , James Qin , Ivo Danihelka , Tulsee Doshi , Martin Chadwick , Jilin Chen , Sanil Jain , Quoc Le , Arjun Kar , Madhu Gurumurthy , Cheng Li , Ruoxin Sang , Fangyu Liu , Lampros Lamprou , Rich Munoz , Nathan Lintz , Harsh Mehta , Heidi Howard , Malcolm Reynolds , Lora Aroyo , Quan Wang , Lorenzo Blanco , Albin Cassirer , Jordan Griffith , Dipanjan Das , Stephan Lee , Jakub Sygnowski , Zach Fisher , James Besley , Richard Powell , Zafarali Ahmed , Dominik Paulus , David Reitter , Zalan Borsos , Rishabh Joshi , Aedan Pope , Steven Hand , Vittorio Selo , Vihan Jain , Nikhil Sethi , Megha Goel , Takaki Makino , Rhys May , Zhen Yang , Johan Schalkwyk , Christina Butterfield , Anja Hauth , Alex Goldin , Will Hawkins , Evan Senter , Sergey Brin , Oliver Woodman , Marvin Ritter , Eric Noland , Minh Giang , Vijay Bolina , Lisa Lee , Tim Blyth , Ian Mackinnon , Machel Reid , Obaid Sarvana , David Silver , Alexander Chen , Lily Wang , Loren Maggiore , Oscar Chang , Nithya Attaluri , Gregory Thornton , Chung-Cheng Chiu , Oskar Bunyan , Nir Levine , Timothy Chung , Evgenii Eltyshev , Xiance Si , Timothy Lillicrap , Demetra Brady , Vaibhav Aggarwal , Boxi Wu , Yuanzhong Xu , Ross McIlroy , Kartikeya Badola , Paramjit Sandhu , Erica Moreira , Wojciech Stokowiec , Ross Hemsley , Dong Li , Alex Tudor , Pranav Shyam , Elahe Rahimtoroghi , Salem Haykal , Pablo Sprechmann , Xiang Zhou , Diana Mincu , Yujia Li , Ravi Addanki , Kalpesh Krishna , Xiao Wu , Alexandre Frechette , Matan Eyal , Allan Dafoe , Dave Lacey , Jay Whang , Thi Avrahami , Ye Zhang , Emanuel Taropa , Hanzhao Lin , Daniel Toyama , Eliza Rutherford , Motoki Sano , HyunJeong Choe , Alex Tomala , Chalence Safranek-Shrader , Nora Kassner , Mantas Pajarskas , Matt Harvey , Sean Sechrist , Meire Fortunato , Christina Lyu , Gamaleldin Elsayed , Chenkai Kuang , James Lottes , Eric Chu , Chao Jia , Chih-Wei Chen , Peter Humphreys , Kate Baumli , Connie Tao , Rajkumar Samuel , Cicero Nogueira dos Santos , Anders Andreassen , Nemanja Rakićević , Dominik Grewe , Aviral Kumar , Stephanie Winkler , Jonathan Caton , Andrew Brock , Sid Dalmia , Hannah Sheahan , Iain Barr , Yingjie Miao , Paul Natsev , Jacob Devlin , Feryal Behbahani , Flavien Prost , Yanhua Sun , Artiom Myaskovsky , Thanumalayan Sankaranarayana Pillai , Dan Hurt , Angeliki Lazaridou , Xi Xiong , Ce Zheng , Fabio Pardo , Xiaowei Li , Dan Horgan , Joe Stanton , Moran Ambar , Fei Xia , Alejandro Lince , Mingqiu Wang , Basil Mustafa , Albert Webson , Hyo Lee , Rohan Anil , Martin Wicke , Timothy Dozat , Abhishek Sinha , Enrique Piqueras , Elahe Dabir , Shyam Upadhyay , Anudhyan Boral , Lisa Anne Hendricks , Corey Fry , Josip Djolonga , Yi Su , Jake Walker , Jane Labanowski , Ronny Huang , Vedant Misra , Jeremy Chen , RJ Skerry-Ryan , Avi Singh , Shruti Rijhwani , Dian Yu , Alex Castro-Ros , Beer Changpinyo , Romina Datta , Sumit Bagri , Arnar Mar Hrafnkelsson , Marcello Maggioni , Daniel Zheng , Yury Sulsky , Shaobo Hou , Tom Le Paine , Antoine Yang , Jason Riesa , Dominika Rogozinska , Dror Marcus , Dalia El Badawy , Qiao Zhang , Luyu Wang , Helen Miller , Jeremy Greer , Lars Lowe Sjos , Azade Nova , Heiga Zen , Rahma Chaabouni , Mihaela Rosca , Jiepu Jiang , Charlie Chen , Ruibo Liu , Tara Sainath , Maxim Krikun , Alex Polozov , Jean-Baptiste Lespiau , Josh Newlan , Zeyncep Cankara , Soo Kwak , Yunhan Xu , Phil Chen , Andy Coenen , Clemens Meyer , Katerina Tsihlas , Ada Ma , Juraj Gottweis , Jinwei Xing , Chenjie Gu , Jin Miao , Christian Frank , Zeynep Cankara , Sanjay Ganapathy , Ishita Dasgupta , Steph Hughes-Fitt , Heng Chen , David Reid , Keran Rong , Hongmin Fan , Joost van Amersfoort , Vincent Zhuang , Aaron Cohen , Shixiang Shane Gu , Anhad Mohananey , Anastasija Ilic , Taylor Tobin , John Wieting , Anna Bortsova , Phoebe Thacker , Emma Wang , Emily Caveness , Justin Chiu , Eren Sezener , Alex Kaskasoli , Steven Baker , Katie Millican , Mohamed Elhawaty , Kostas Aisopos , Carl Lebsack , Nathan Byrd , Hanjun Dai , Wenhao Jia , Matthew Wiethoff , Elnaz Davoodi , Albert Weston , Lakshman Yagati , Arun Ahuja , Isabel Gao , Golan Pundak , Susan Zhang , Michael Azzam , Khe Chai Sim , Sergi Caelles , James Keeling , Abhanshu Sharma , Andy Swing , YaGuang Li , Chenxi Liu , Carrie Grimes Bostock , Yamini Bansal , Zachary Nado , Ankesh Anand , Josh Lipschultz , Abhijit Karmarkar , Lev Proleev , Abe Ittycheriah , Soheil Hassas Yeganeh , George Polovets , Aleksandra Faust , Jiao Sun , Alban Rrustemi , Pen Li , Rakesh Shivanna , Jeremiah Liu , Chris Welty , Federico Lebron , Anirudh Baddepudi , Sebastian Krause , Emilio Parisotto , Radu Soricut , Zheng Xu , Dawn Bloxwich , Melvin Johnson , Behnam Neyshabur , Justin Mao-Jones , Renshen Wang , Vinay Ramasesh , Zaheer Abbas , Arthur Guez , Constant Segal , Duc Dung Nguyen , James Svensson , Le Hou , Sarah York , Kieran Milan , Sophie Bridgers , Wiktor Gworek , Marco Tagliasacchi , James Lee-Thorp , Michael Chang , Alexey Guseynov , Ale Jakse Hartman , Michael Kwong , Ruizhe Zhao , Sheleem Kashem , Elizabeth Cole , Antoine Miech , Richard Tanburn , Mary Phuong , Filip Pavetic , Sebastien Cevey , Ramona Comanescu , Richard Ives , Sherry Yang , Cosmo Du , Bo Li , Zizhao Zhang , Mariko Iinuma , Clara Huiyi Hu , Aurko Roy , Shaan Bijwadia , Zhenkai Zhu , Danilo Martins , Rachel Saputro , Anita Gergely , Steven Zheng , Dawei Jia , Ioannis Antonoglou , Adam Sadovsky , Shane Gu , Yingying Bi , Alek Andreev , Sina Samangooei , Mina Khan , Tomas Kocisky , Angelos Filos , Chintu Kumar , Colton Bishop , Adams Yu , Sarah Hodkinson , Sid Mittal , Premal Shah , Alexandre Moufarek , Yong Cheng , Adam Bloniarz , Jaehoon Lee , Pedram Pejman , Paul Michel , Stephen Spencer , Vladimir Feinberg , Xuehan Xiong , Nikolay Savinov , Charlotte Smith , Siamak Shakeri , Dustin Tran , Mary Chesus , Bernd Bohnet , George Tucker , Tamara von Glehn , Carrie Muir , Yiran Mao , Hideto Kazawa , Ambrose Slone , Kedar Soparkar , Disha Shrivastava , James Cobon-Kerr , Michael Sharman , Jay Pavagadhi , Carlos Araya , Karolis Misiunas , Nimesh Ghelani , Michael Laskin , David Barker , Qiujia Li , Anton Briukhov , Neil Houlsby , Mia Glaese , Balaji Lakshminarayanan , Nathan Schucher , Yunhao Tang , Eli Collins , Hyeontaek Lim , Fangxiaoyu Feng , Adria Recasens , Guangda Lai , Alberto Magni , Nicola De Cao , Aditya Siddhant , Zoe Ashwood , Jordi Orbay , Mostafa Dehghani , Jenny Brennan , Yifan He , Kelvin Xu , Yang Gao , Carl Saroufim , James Molloy , Xinyi Wu , Seb Arnold , Solomon Chang , Julian Schrittwieser , Elena Buchatskaya , Soroush Radpour , Martin Polacek , Skye Giordano , Ankur Bapna , Simon Tokumine , Vincent Hellendoorn , Thibault Sottiaux , Sarah Cogan , Aliaksei Severyn , Mohammad Saleh , Shantanu Thakoor , Laurent Shefey , Siyuan Qiao , Meenu Gaba , Shuo-yiin Chang , Craig Swanson , Biao Zhang , Benjamin Lee , Paul Kishan Rubenstein , Gan Song , Tom Kwiatkowski , Anna Koop , Ajay Kannan , David Kao , Parker Schuh , Axel Stjerngren , Golnaz Ghiasi , Gena Gibson , Luke Vilnis , Ye Yuan , Felipe Tiengo Ferreira , Aishwarya Kamath , Ted Klimenko , Ken Franko , Kefan Xiao , Indro Bhattacharya , Miteyan Patel , Rui Wang , Alex Morris , Robin Strudel , Vivek Sharma , Peter Choy , Sayed Hadi Hashemi , Jessica Landon , Mara Finkelstein , Priya Jhakra , Justin Frye , Megan Barnes , Matthew Mauger , Dennis Daun , Khuslen Baatarsukh , Matthew Tung , Wael Farhan , Henryk Michalewski , Fabio Viola , Felix de Chaumont Quitry , Charline Le Lan , Tom Hudson , Qingze Wang , Felix Fischer , Ivy Zheng , Elspeth White , Anca Dragan , Jean-baptiste Alayrac , Eric Ni , Alexander Pritzel , Adam Iwanicki , Michael Isard , Anna Bulanova , Lukas Zilka , Ethan Dyer , Devendra Sachan , Srivatsan Srinivasan , Hannah Muckenhirn , Honglong Cai , Amol Mandhane , Mukarram Tariq , Jack W. Rae , Gary Wang , Kareem Ayoub , Nicholas FitzGerald , Yao Zhao , Woohyun Han , Chris Alberti , Dan Garrette , Kashyap Krishnakumar , Mai Gimenez , Anselm Levskaya , Daniel Sohn , Josip Matak , Inaki Iturrate , Michael B. Chang , Jackie Xiang , Yuan Cao , Nishant Ranka , Geoff Brown , Adrian Hutter , Vahab Mirrokni , Nanxin Chen , Kaisheng Yao , Zoltan Egyed , Francois Galilee , Tyler Liechty , Praveen Kallakuri , Evan Palmer , Sanjay Ghemawat , Jasmine Liu , David Tao , Chloe Thornton , Tim Green , Mimi Jasarevic , Sharon Lin , Victor Cotruta , Yi-Xuan Tan , Noah Fiedel , Hongkun Yu , Ed Chi , Alexander Neitz , Jens Heitkaemper , Anu Sinha , Denny Zhou , Yi Sun , Charbel Kaed , Brice Hulse , Swaroop Mishra , Maria Georgaki , Sneha Kudugunta , Clement Farabet , Izhak Shafran , Daniel Vlasic , Anton Tsitsulin , Rajagopal Ananthanarayanan , Alen Carin , Guolong Su , Pei Sun , Shashank V , Gabriel Carvajal , Josef Broder , Iulia Comsa , Alena Repina , William Wong , Warren Weilun Chen , Peter Hawkins , Egor Filonov , Lucia Loher , Christoph Hirnschall , Weiyi Wang , Jingchen Ye , Andrea Burns , Hardie Cate , Diana Gage Wright , Federico Piccinini , Lei Zhang , Chu-Cheng Lin , Ionel Gog , Yana Kulizhskaya , Ashwin Sreevatsa , Shuang Song , Luis C. Cobo , Anand Iyer , Chetan Tekur , Guillermo Garrido , Zhuyun Xiao , Rupert Kemp , Huaixiu Steven Zheng , Hui Li , Ananth Agarwal , Christel Ngani , Kati Goshvadi , Rebeca Santamaria-Fernandez , Wojciech Fica , Xinyun Chen , Chris Gorgolewski , Sean Sun , Roopal Garg , Xinyu Ye , S. M. Ali Eslami , Nan Hua , Jon Simon , Pratik Joshi , Yelin Kim , Ian Tenney , Sahitya Potluri , Lam Nguyen Thiet , Quan Yuan , Florian Luisier , Alexandra Chronopoulou , Salvatore Scellato , Praveen Srinivasan , Minmin Chen , Vinod Koverkathu , Valentin Dalibard , Yaming Xu , Brennan Saeta , Keith Anderson , Thibault Sellam , Nick Fernando , Fantine Huot , Junehyuk Jung , Mani Varadarajan , Michael Quinn , Amit Raul , Maigo Le , Ruslan Habalov , Jon Clark , Komal Jalan , Kalesha Bullard , Achintya Singhal , Thang Luong , Boyu Wang , Sujeevan Rajayogam , Julian Eisenschlos , Johnson Jia , Daniel Finchelstein , Alex Yakubovich , Daniel Balle , Michael Fink , Sameer Agarwal , Jing Li , Dj Dvijotham , Shalini Pal , Kai Kang , Jaclyn Konzelmann , Jennifer Beattie , Olivier Dousse , Diane Wu , Remi Crocker , Chen Elkind , Siddhartha Reddy Jonnalagadda , Jong Lee , Dan Holtmann-Rice , Krystal Kallarackal , Rosanne Liu , Denis Vnukov , Neera Vats , Luca Invernizzi , Mohsen Jafari , Huanjie Zhou , Lilly Taylor , Jennifer Prendki , Marcus Wu , Tom Eccles , Tianqi Liu , Kavya Kopparapu , Francoise Beaufays , Christof Angermueller , Andreea Marzoca , Shourya Sarcar , Hilal Dib , Jeff Stanway , Frank Perbet , Nejc Trdin , Rachel Sterneck , Andrey Khorlin , Dinghua Li , Xihui Wu , Sonam Goenka , David Madras , Sasha Goldshtein , Willi Gierke , Tong Zhou , Yaxin Liu , Yannie Liang , Anais White , Yunjie Li , Shreya Singh , Sanaz Bahargam , Mark Epstein , Sujoy Basu , Li Lao , Adnan Ozturel , Carl Crous , Alex Zhai , Han Lu , Zora Tung , Neeraj Gaur , Alanna Walton , Lucas Dixon , Ming Zhang , Amir Globerson , Grant Uy , Andrew Bolt , Olivia Wiles , Milad Nasr , Ilia Shumailov , Marco Selvi , Francesco Piccinno , Ricardo Aguilar , Sara McCarthy , Misha Khalman , Mrinal Shukla , Vlado Galic , John Carpenter , Kevin Villela , Haibin Zhang , Harry Richardson , James Martens , Matko Bosnjak , Shreyas Rammohan Belle , Jeff Seibert , Mahmoud Alnahlawi , Brian McWilliams , Sankalp Singh , Annie Louis , Wen Ding , Dan Popovici , Lenin Simicich , Laura Knight , Pulkit Mehta , Nishesh Gupta , Chongyang Shi , Saaber Fatehi , Jovana Mitrovic , Alex Grills , Joseph Pagadora , Tsendsuren Munkhdalai , Dessie Petrova , Danielle Eisenbud , Zhishuai Zhang , Damion Yates , Bhavishya Mittal , Nilesh Tripuraneni , Yannis Assael , Thomas Brovelli , Prateek Jain , Mihajlo Velimirovic , Canfer Akbulut , Jiaqi Mu , Wolfgang Macherey , Ravin Kumar , Jun Xu , Haroon Qureshi , Gheorghe Comanici , Jeremy Wiesner , Zhitao Gong , Anton Ruddock , Matthias Bauer , Nick Felt , Anirudh GP , Anurag Arnab , Dustin Zelle , Jonas Rothfuss , Bill Rosgen , Ashish Shenoy , Bryan Seybold , Xinjian Li , Jayaram Mudigonda , Goker Erdogan , Jiawei Xia , Jiri Simsa , Andrea Michi , Yi Yao , Christopher Yew , Steven Kan , Isaac Caswell , Carey Radebaugh , Andre Elisseeff , Pedro Valenzuela , Kay McKinney , Kim Paterson , Albert Cui , Eri Latorre-Chimoto , Solomon Kim , William Zeng , Ken Durden , Priya Ponnapalli , Tiberiu Sosea , Christopher A. Choquette-Choo , James Manyika , Brona Robenek , Harsha Vashisht , Sebastien Pereira , Hoi Lam , Marko Velic , Denese Owusu-Afriyie , Katherine Lee , Tolga Bolukbasi , Alicia Parrish , Shawn Lu , Jane Park , Balaji Venkatraman , Alice Talbert , Lambert Rosique , Yuchung Cheng , Andrei Sozanschi , Adam Paszke , Praveen Kumar , Jessica Austin , Lu Li , Khalid Salama , Bartek Perz , Wooyeol Kim , Nandita Dukkipati , Anthony Baryshnikov , Christos Kaplanis , XiangHai Sheng , Yuri Chervonyi , Caglar Unlu , Diego de Las Casas , Harry Askham , Kathryn Tunyasuvunakool , Felix Gimeno , Siim Poder , Chester Kwak , Matt Miecnikowski , Vahab Mirrokni , Alek Dimitriev , Aaron Parisi , Dangyi Liu , Tomy Tsai , Toby Shevlane , Christina Kouridi , Drew Garmon , Adrian Goedeckemeyer , Adam R. Brown , Anitha Vijayakumar , Ali Elqursh , Sadegh Jazayeri , Jin Huang , Sara Mc Carthy , Jay Hoover , Lucy Kim , Sandeep Kumar , Wei Chen , Courtney Biles , Garrett Bingham , Evan Rosen , Lisa Wang , Qijun Tan , David Engel , Francesco Pongetti , Dario de Cesare , Dongseong Hwang , Lily Yu , Jennifer Pullman , Srini Narayanan , Kyle Levin , Siddharth Gopal , Megan Li , Asaf Aharoni , Trieu Trinh , Jessica Lo , Norman Casagrande , Roopali Vij , Loic Matthey , Bramandia Ramadhana , Austin Matthews , CJ Carey , Matthew Johnson , Kremena Goranova , Rohin Shah , Shereen Ashraf , Kingshuk Dasgupta , Rasmus Larsen , Yicheng Wang , Manish Reddy Vuyyuru , Chong Jiang , Joana Ijazi , Kazuki Osawa , Celine Smith , Ramya Sree Boppana , Taylan Bilal , Yuma Koizumi , Ying Xu , Yasemin Altun , Nir Shabat , Ben Bariach , Alex Korchemniy , Kiam Choo , Olaf Ronneberger , Chimezie Iwuanyanwu , Shubin Zhao , David Soergel , Cho-Jui Hsieh , Irene Cai , Shariq Iqbal , Martin Sundermeyer , Zhe Chen , Elie Bursztein , Chaitanya Malaviya , Fadi Biadsy , Prakash Shroff , Inderjit Dhillon , Tejasi Latkar , Chris Dyer , Hannah Forbes , Massimo Nicosia , Vitaly Nikolaev , Somer Greene , Marin Georgiev , Pidong Wang , Nina Martin , Hanie Sedghi , John Zhang , Praseem Banzal , Doug Fritz , Vikram Rao , Xuezhi Wang , Jiageng Zhang , Viorica Patraucean , Dayou Du , Igor Mordatch , Ivan Jurin , Lewis Liu , Ayush Dubey , Abhi Mohan , Janek Nowakowski , Vlad-Doru Ion , Nan Wei , Reiko Tojo , Maria Abi Raad , Drew A. Hudson , Vaishakh Keshava , Shubham Agrawal , Kevin Ramirez , Zhichun Wu , Hoang Nguyen , Ji Liu , Madhavi Sewak , Bryce Petrini , DongHyun Choi , Ivan Philips , Ziyue Wang , Ioana Bica , Ankush Garg , Jarek Wilkiewicz , Priyanka Agrawal , Xiaowei Li , Danhao Guo , Emily Xue , Naseer Shaik , Andrew Leach , Sadh MNM Khan , Julia Wiesinger , Sammy Jerome , Abhishek Chakladar , Alek Wenjiao Wang , Tina Ornduff , Folake Abu , Alireza Ghaffarkhah , Marcus Wainwright , Mario Cortes , Frederick Liu , Joshua Maynez , Andreas Terzis , Pouya Samangouei , Riham Mansour , Tomasz Kępa , François-Xavier Aubet , Anton Algymr , Dan Banica , Agoston Weisz , Andras Orban , Alexandre Senges , Ewa Andrejczuk , Mark Geller , Niccolo Dal Santo , Valentin Anklin , Majd Al Merey , Martin Baeuml , Trevor Strohman , Junwen Bai , Slav Petrov , Yonghui Wu , Demis Hassabis , Koray Kavukcuoglu , Jeff Dean , Oriol Vinyals

ChatQA 2: Bridging the Gap to Proprietary LLMs in Long Context and RAG Capabilities

In this work, we introduce ChatQA 2, an Llama 3.0-based model with a 128K context window, designed to bridge the gap between open-source LLMs and leading proprietary models (e.g., GPT-4-Turbo-2024-04-09) in long context understanding and…

Computation and Language · Computer Science 2025-02-18 Peng Xu , Wei Ping , Xianchao Wu , Chejian Xu , Zihan Liu , Mohammad Shoeybi , Bryan Catanzaro

Gemma: Open Models Based on Gemini Research and Technology

This work introduces Gemma, a family of lightweight, state-of-the art open models built from the research and technology used to create Gemini models. Gemma models demonstrate strong performance across academic benchmarks for language…

Computation and Language · Computer Science 2024-04-17 Gemma Team , Thomas Mesnard , Cassidy Hardin , Robert Dadashi , Surya Bhupatiraju , Shreya Pathak , Laurent Sifre , Morgane Rivière , Mihir Sanjay Kale , Juliette Love , Pouya Tafti , Léonard Hussenot , Pier Giuseppe Sessa , Aakanksha Chowdhery , Adam Roberts , Aditya Barua , Alex Botev , Alex Castro-Ros , Ambrose Slone , Amélie Héliou , Andrea Tacchetti , Anna Bulanova , Antonia Paterson , Beth Tsai , Bobak Shahriari , Charline Le Lan , Christopher A. Choquette-Choo , Clément Crepy , Daniel Cer , Daphne Ippolito , David Reid , Elena Buchatskaya , Eric Ni , Eric Noland , Geng Yan , George Tucker , George-Christian Muraru , Grigory Rozhdestvenskiy , Henryk Michalewski , Ian Tenney , Ivan Grishchenko , Jacob Austin , James Keeling , Jane Labanowski , Jean-Baptiste Lespiau , Jeff Stanway , Jenny Brennan , Jeremy Chen , Johan Ferret , Justin Chiu , Justin Mao-Jones , Katherine Lee , Kathy Yu , Katie Millican , Lars Lowe Sjoesund , Lisa Lee , Lucas Dixon , Machel Reid , Maciej Mikuła , Mateo Wirth , Michael Sharman , Nikolai Chinaev , Nithum Thain , Olivier Bachem , Oscar Chang , Oscar Wahltinez , Paige Bailey , Paul Michel , Petko Yotov , Rahma Chaabouni , Ramona Comanescu , Reena Jana , Rohan Anil , Ross McIlroy , Ruibo Liu , Ryan Mullins , Samuel L Smith , Sebastian Borgeaud , Sertan Girgin , Sholto Douglas , Shree Pandya , Siamak Shakeri , Soham De , Ted Klimenko , Tom Hennigan , Vlad Feinberg , Wojciech Stokowiec , Yu-hui Chen , Zafarali Ahmed , Zhitao Gong , Tris Warkentin , Ludovic Peran , Minh Giang , Clément Farabet , Oriol Vinyals , Jeff Dean , Koray Kavukcuoglu , Demis Hassabis , Zoubin Ghahramani , Douglas Eck , Joelle Barral , Fernando Pereira , Eli Collins , Armand Joulin , Noah Fiedel , Evan Senter , Alek Andreev , Kathleen Kenealy

T5Gemma 2: Seeing, Reading, and Understanding Longer

We introduce T5Gemma 2, the next generation of the T5Gemma family of lightweight open encoder-decoder models, featuring strong multilingual, multimodal and long-context capabilities. T5Gemma 2 follows the adaptation recipe (via UL2) in…

Computation and Language · Computer Science 2025-12-25 Biao Zhang , Paul Suganthan , Gaël Liu , Ilya Philippov , Sahil Dua , Ben Hora , Kat Black , Gus Martins , Omar Sanseviero , Shreya Pathak , Cassidy Hardin , Francesco Visin , Jiageng Zhang , Kathleen Kenealy , Qin Yin , Xiaodan Song , Olivier Lacombe , Armand Joulin , Tris Warkentin , Adam Roberts

Empowering Smaller Models: Tuning LLaMA and Gemma with Chain-of-Thought for Ukrainian Exam Tasks

Leading large language models have demonstrated impressive capabilities in reasoning-intensive tasks, such as standardized educational testing. However, they often require extensive training in low-resource settings with inaccessible…

Computation and Language · Computer Science 2025-03-19 Mykyta Syromiatnikov , Victoria Ruvinskaya , Nataliia Komleva

LLaVA-Gemma: Accelerating Multimodal Foundation Models with a Compact Language Model

We train a suite of multimodal foundation models (MMFM) using the popular LLaVA framework with the recently released Gemma family of large language models (LLMs). Of particular interest is the 2B parameter Gemma model, which provides…

Computation and Language · Computer Science 2024-06-12 Musashi Hinck , Matthew L. Olson , David Cobbley , Shao-Yen Tseng , Vasudev Lal

Qwen3 Technical Report

In this work, we present Qwen3, the latest version of the Qwen model family. Qwen3 comprises a series of large language models (LLMs) designed to advance performance, efficiency, and multilingual capabilities. The Qwen3 series includes…

Computation and Language · Computer Science 2025-05-15 An Yang , Anfeng Li , Baosong Yang , Beichen Zhang , Binyuan Hui , Bo Zheng , Bowen Yu , Chang Gao , Chengen Huang , Chenxu Lv , Chujie Zheng , Dayiheng Liu , Fan Zhou , Fei Huang , Feng Hu , Hao Ge , Haoran Wei , Huan Lin , Jialong Tang , Jian Yang , Jianhong Tu , Jianwei Zhang , Jianxin Yang , Jiaxi Yang , Jing Zhou , Jingren Zhou , Junyang Lin , Kai Dang , Keqin Bao , Kexin Yang , Le Yu , Lianghao Deng , Mei Li , Mingfeng Xue , Mingze Li , Pei Zhang , Peng Wang , Qin Zhu , Rui Men , Ruize Gao , Shixuan Liu , Shuang Luo , Tianhao Li , Tianyi Tang , Wenbiao Yin , Xingzhang Ren , Xinyu Wang , Xinyu Zhang , Xuancheng Ren , Yang Fan , Yang Su , Yichang Zhang , Yinger Zhang , Yu Wan , Yuqiong Liu , Zekun Wang , Zeyu Cui , Zhenru Zhang , Zhipeng Zhou , Zihan Qiu

CodeGemma: Open Code Models Based on Gemma

This paper introduces CodeGemma, a collection of specialized open code models built on top of Gemma, capable of a variety of code and natural language generation tasks. We release three model variants. CodeGemma 7B pretrained (PT) and…

Computation and Language · Computer Science 2024-06-21 CodeGemma Team , Heri Zhao , Jeffrey Hui , Joshua Howland , Nam Nguyen , Siqi Zuo , Andrea Hu , Christopher A. Choquette-Choo , Jingyue Shen , Joe Kelley , Kshitij Bansal , Luke Vilnis , Mateo Wirth , Paul Michel , Peter Choy , Pratik Joshi , Ravin Kumar , Sarmad Hashmi , Shubham Agrawal , Zhitao Gong , Jane Fine , Tris Warkentin , Ale Jakse Hartman , Bin Ni , Kathy Korevec , Kelly Schaefer , Scott Huffman

MobileLLM-Pro Technical Report

Efficient on-device language models around 1 billion parameters are essential for powering low-latency AI applications on mobile and wearable devices. However, achieving strong performance in this model class, while supporting long context…

Machine Learning · Computer Science 2025-11-11 Patrick Huber , Ernie Chang , Wei Wen , Igor Fedorov , Tarek Elgamal , Hanxian Huang , Naveen Suda , Chinnadhurai Sankar , Vish Vogeti , Yanghan Wang , Alex Gladkov , Kai Sheng Tai , Abdelrahman Elogeel , Tarek Hefny , Vikas Chandra , Ahmed Aly , Anuj Kumar , Raghuraman Krishnamoorthi , Adithya Sagar

GEB-1.3B: Open Lightweight Large Language Model

Recently developed large language models (LLMs) such as ChatGPT, Claude, and Llama have demonstrated impressive abilities, and even surpass human-level performance in several tasks. Despite their success, the resource-intensive demands of…

Computation and Language · Computer Science 2024-06-17 Jie Wu , Yufeng Zhu , Lei Shen , Xuqing Lu

Extending Llama-3's Context Ten-Fold Overnight

We extend the context length of Llama-3-8B-Instruct from 8K to 80K via QLoRA fine-tuning. The entire training cycle is super efficient, which takes 8 hours on one 8xA800 (80G) GPU machine. The resulted model exhibits superior performances…

Computation and Language · Computer Science 2024-05-01 Peitian Zhang , Ninglu Shao , Zheng Liu , Shitao Xiao , Hongjin Qian , Qiwei Ye , Zhicheng Dou

The Llama 3 Herd of Models

Modern artificial intelligence (AI) systems are powered by foundation models. This paper presents a new set of foundation models, called Llama 3. It is a herd of language models that natively support multilinguality, coding, reasoning, and…

Artificial Intelligence · Computer Science 2024-11-26 Aaron Grattafiori , Abhimanyu Dubey , Abhinav Jauhri , Abhinav Pandey , Abhishek Kadian , Ahmad Al-Dahle , Aiesha Letman , Akhil Mathur , Alan Schelten , Alex Vaughan , Amy Yang , Angela Fan , Anirudh Goyal , Anthony Hartshorn , Aobo Yang , Archi Mitra , Archie Sravankumar , Artem Korenev , Arthur Hinsvark , Arun Rao , Aston Zhang , Aurelien Rodriguez , Austen Gregerson , Ava Spataru , Baptiste Roziere , Bethany Biron , Binh Tang , Bobbie Chern , Charlotte Caucheteux , Chaya Nayak , Chloe Bi , Chris Marra , Chris McConnell , Christian Keller , Christophe Touret , Chunyang Wu , Corinne Wong , Cristian Canton Ferrer , Cyrus Nikolaidis , Damien Allonsius , Daniel Song , Danielle Pintz , Danny Livshits , Danny Wyatt , David Esiobu , Dhruv Choudhary , Dhruv Mahajan , Diego Garcia-Olano , Diego Perino , Dieuwke Hupkes , Egor Lakomkin , Ehab AlBadawy , Elina Lobanova , Emily Dinan , Eric Michael Smith , Filip Radenovic , Francisco Guzmán , Frank Zhang , Gabriel Synnaeve , Gabrielle Lee , Georgia Lewis Anderson , Govind Thattai , Graeme Nail , Gregoire Mialon , Guan Pang , Guillem Cucurell , Hailey Nguyen , Hannah Korevaar , Hu Xu , Hugo Touvron , Iliyan Zarov , Imanol Arrieta Ibarra , Isabel Kloumann , Ishan Misra , Ivan Evtimov , Jack Zhang , Jade Copet , Jaewon Lee , Jan Geffert , Jana Vranes , Jason Park , Jay Mahadeokar , Jeet Shah , Jelmer van der Linde , Jennifer Billock , Jenny Hong , Jenya Lee , Jeremy Fu , Jianfeng Chi , Jianyu Huang , Jiawen Liu , Jie Wang , Jiecao Yu , Joanna Bitton , Joe Spisak , Jongsoo Park , Joseph Rocca , Joshua Johnstun , Joshua Saxe , Junteng Jia , Kalyan Vasuden Alwala , Karthik Prasad , Kartikeya Upasani , Kate Plawiak , Ke Li , Kenneth Heafield , Kevin Stone , Khalid El-Arini , Krithika Iyer , Kshitiz Malik , Kuenley Chiu , Kunal Bhalla , Kushal Lakhotia , Lauren Rantala-Yeary , Laurens van der Maaten , Lawrence Chen , Liang Tan , Liz Jenkins , Louis Martin , Lovish Madaan , Lubo Malo , Lukas Blecher , Lukas Landzaat , Luke de Oliveira , Madeline Muzzi , Mahesh Pasupuleti , Mannat Singh , Manohar Paluri , Marcin Kardas , Maria Tsimpoukelli , Mathew Oldham , Mathieu Rita , Maya Pavlova , Melanie Kambadur , Mike Lewis , Min Si , Mitesh Kumar Singh , Mona Hassan , Naman Goyal , Narjes Torabi , Nikolay Bashlykov , Nikolay Bogoychev , Niladri Chatterji , Ning Zhang , Olivier Duchenne , Onur Çelebi , Patrick Alrassy , Pengchuan Zhang , Pengwei Li , Petar Vasic , Peter Weng , Prajjwal Bhargava , Pratik Dubal , Praveen Krishnan , Punit Singh Koura , Puxin Xu , Qing He , Qingxiao Dong , Ragavan Srinivasan , Raj Ganapathy , Ramon Calderer , Ricardo Silveira Cabral , Robert Stojnic , Roberta Raileanu , Rohan Maheswari , Rohit Girdhar , Rohit Patel , Romain Sauvestre , Ronnie Polidoro , Roshan Sumbaly , Ross Taylor , Ruan Silva , Rui Hou , Rui Wang , Saghar Hosseini , Sahana Chennabasappa , Sanjay Singh , Sean Bell , Seohyun Sonia Kim , Sergey Edunov , Shaoliang Nie , Sharan Narang , Sharath Raparthy , Sheng Shen , Shengye Wan , Shruti Bhosale , Shun Zhang , Simon Vandenhende , Soumya Batra , Spencer Whitman , Sten Sootla , Stephane Collot , Suchin Gururangan , Sydney Borodinsky , Tamar Herman , Tara Fowler , Tarek Sheasha , Thomas Georgiou , Thomas Scialom , Tobias Speckbacher , Todor Mihaylov , Tong Xiao , Ujjwal Karn , Vedanuj Goswami , Vibhor Gupta , Vignesh Ramanathan , Viktor Kerkez , Vincent Gonguet , Virginie Do , Vish Vogeti , Vítor Albiero , Vladan Petrovic , Weiwei Chu , Wenhan Xiong , Wenyin Fu , Whitney Meers , Xavier Martinet , Xiaodong Wang , Xiaofang Wang , Xiaoqing Ellen Tan , Xide Xia , Xinfeng Xie , Xuchao Jia , Xuewei Wang , Yaelle Goldschlag , Yashesh Gaur , Yasmine Babaei , Yi Wen , Yiwen Song , Yuchen Zhang , Yue Li , Yuning Mao , Zacharie Delpierre Coudert , Zheng Yan , Zhengxing Chen , Zoe Papakipos , Aaditya Singh , Aayushi Srivastava , Abha Jain , Adam Kelsey , Adam Shajnfeld , Adithya Gangidi , Adolfo Victoria , Ahuva Goldstand , Ajay Menon , Ajay Sharma , Alex Boesenberg , Alexei Baevski , Allie Feinstein , Amanda Kallet , Amit Sangani , Amos Teo , Anam Yunus , Andrei Lupu , Andres Alvarado , Andrew Caples , Andrew Gu , Andrew Ho , Andrew Poulton , Andrew Ryan , Ankit Ramchandani , Annie Dong , Annie Franco , Anuj Goyal , Aparajita Saraf , Arkabandhu Chowdhury , Ashley Gabriel , Ashwin Bharambe , Assaf Eisenman , Azadeh Yazdan , Beau James , Ben Maurer , Benjamin Leonhardi , Bernie Huang , Beth Loyd , Beto De Paola , Bhargavi Paranjape , Bing Liu , Bo Wu , Boyu Ni , Braden Hancock , Bram Wasti , Brandon Spence , Brani Stojkovic , Brian Gamido , Britt Montalvo , Carl Parker , Carly Burton , Catalina Mejia , Ce Liu , Changhan Wang , Changkyu Kim , Chao Zhou , Chester Hu , Ching-Hsiang Chu , Chris Cai , Chris Tindal , Christoph Feichtenhofer , Cynthia Gao , Damon Civin , Dana Beaty , Daniel Kreymer , Daniel Li , David Adkins , David Xu , Davide Testuggine , Delia David , Devi Parikh , Diana Liskovich , Didem Foss , Dingkang Wang , Duc Le , Dustin Holland , Edward Dowling , Eissa Jamil , Elaine Montgomery , Eleonora Presani , Emily Hahn , Emily Wood , Eric-Tuan Le , Erik Brinkman , Esteban Arcaute , Evan Dunbar , Evan Smothers , Fei Sun , Felix Kreuk , Feng Tian , Filippos Kokkinos , Firat Ozgenel , Francesco Caggioni , Frank Kanayet , Frank Seide , Gabriela Medina Florez , Gabriella Schwarz , Gada Badeer , Georgia Swee , Gil Halpern , Grant Herman , Grigory Sizov , Guangyi , Zhang , Guna Lakshminarayanan , Hakan Inan , Hamid Shojanazeri , Han Zou , Hannah Wang , Hanwen Zha , Haroun Habeeb , Harrison Rudolph , Helen Suk , Henry Aspegren , Hunter Goldman , Hongyuan Zhan , Ibrahim Damlaj , Igor Molybog , Igor Tufanov , Ilias Leontiadis , Irina-Elena Veliche , Itai Gat , Jake Weissman , James Geboski , James Kohli , Janice Lam , Japhet Asher , Jean-Baptiste Gaya , Jeff Marcus , Jeff Tang , Jennifer Chan , Jenny Zhen , Jeremy Reizenstein , Jeremy Teboul , Jessica Zhong , Jian Jin , Jingyi Yang , Joe Cummings , Jon Carvill , Jon Shepard , Jonathan McPhie , Jonathan Torres , Josh Ginsburg , Junjie Wang , Kai Wu , Kam Hou U , Karan Saxena , Kartikay Khandelwal , Katayoun Zand , Kathy Matosich , Kaushik Veeraraghavan , Kelly Michelena , Keqian Li , Kiran Jagadeesh , Kun Huang , Kunal Chawla , Kyle Huang , Lailin Chen , Lakshya Garg , Lavender A , Leandro Silva , Lee Bell , Lei Zhang , Liangpeng Guo , Licheng Yu , Liron Moshkovich , Luca Wehrstedt , Madian Khabsa , Manav Avalani , Manish Bhatt , Martynas Mankus , Matan Hasson , Matthew Lennie , Matthias Reso , Maxim Groshev , Maxim Naumov , Maya Lathi , Meghan Keneally , Miao Liu , Michael L. Seltzer , Michal Valko , Michelle Restrepo , Mihir Patel , Mik Vyatskov , Mikayel Samvelyan , Mike Clark , Mike Macey , Mike Wang , Miquel Jubert Hermoso , Mo Metanat , Mohammad Rastegari , Munish Bansal , Nandhini Santhanam , Natascha Parks , Natasha White , Navyata Bawa , Nayan Singhal , Nick Egebo , Nicolas Usunier , Nikhil Mehta , Nikolay Pavlovich Laptev , Ning Dong , Norman Cheng , Oleg Chernoguz , Olivia Hart , Omkar Salpekar , Ozlem Kalinli , Parkin Kent , Parth Parekh , Paul Saab , Pavan Balaji , Pedro Rittner , Philip Bontrager , Pierre Roux , Piotr Dollar , Polina Zvyagina , Prashant Ratanchandani , Pritish Yuvraj , Qian Liang , Rachad Alao , Rachel Rodriguez , Rafi Ayub , Raghotham Murthy , Raghu Nayani , Rahul Mitra , Rangaprabhu Parthasarathy , Raymond Li , Rebekkah Hogan , Robin Battey , Rocky Wang , Russ Howes , Ruty Rinott , Sachin Mehta , Sachin Siby , Sai Jayesh Bondu , Samyak Datta , Sara Chugh , Sara Hunt , Sargun Dhillon , Sasha Sidorov , Satadru Pan , Saurabh Mahajan , Saurabh Verma , Seiji Yamamoto , Sharadh Ramaswamy , Shaun Lindsay , Shaun Lindsay , Sheng Feng , Shenghao Lin , Shengxin Cindy Zha , Shishir Patil , Shiva Shankar , Shuqiang Zhang , Shuqiang Zhang , Sinong Wang , Sneha Agarwal , Soji Sajuyigbe , Soumith Chintala , Stephanie Max , Stephen Chen , Steve Kehoe , Steve Satterfield , Sudarshan Govindaprasad , Sumit Gupta , Summer Deng , Sungmin Cho , Sunny Virk , Suraj Subramanian , Sy Choudhury , Sydney Goldman , Tal Remez , Tamar Glaser , Tamara Best , Thilo Koehler , Thomas Robinson , Tianhe Li , Tianjun Zhang , Tim Matthews , Timothy Chou , Tzook Shaked , Varun Vontimitta , Victoria Ajayi , Victoria Montanez , Vijai Mohan , Vinay Satish Kumar , Vishal Mangla , Vlad Ionescu , Vlad Poenaru , Vlad Tiberiu Mihailescu , Vladimir Ivanov , Wei Li , Wenchen Wang , Wenwen Jiang , Wes Bouaziz , Will Constable , Xiaocheng Tang , Xiaojian Wu , Xiaolan Wang , Xilun Wu , Xinbo Gao , Yaniv Kleinman , Yanjun Chen , Ye Hu , Ye Jia , Ye Qi , Yenda Li , Yilin Zhang , Ying Zhang , Yossi Adi , Youngjin Nam , Yu , Wang , Yu Zhao , Yuchen Hao , Yundi Qian , Yunlu Li , Yuzi He , Zach Rait , Zachary DeVito , Zef Rosnbrick , Zhaoduo Wen , Zhenyu Yang , Zhiwei Zhao , Zhiyu Ma

Mini-Gemini: Mining the Potential of Multi-modality Vision Language Models

In this work, we introduce Mini-Gemini, a simple and effective framework enhancing multi-modality Vision Language Models (VLMs). Despite the advancements in VLMs facilitating basic visual dialog and reasoning, a performance gap persists…

Computer Vision and Pattern Recognition · Computer Science 2024-03-28 Yanwei Li , Yuechen Zhang , Chengyao Wang , Zhisheng Zhong , Yixin Chen , Ruihang Chu , Shaoteng Liu , Jiaya Jia

Qwen3-VL Technical Report

We introduce Qwen3-VL, the most capable vision-language model in the Qwen series to date, achieving superior performance across a broad range of multimodal benchmarks. It natively supports interleaved contexts of up to 256K tokens,…

Computer Vision and Pattern Recognition · Computer Science 2025-12-01 Shuai Bai , Yuxuan Cai , Ruizhe Chen , Keqin Chen , Xionghui Chen , Zesen Cheng , Lianghao Deng , Wei Ding , Chang Gao , Chunjiang Ge , Wenbin Ge , Zhifang Guo , Qidong Huang , Jie Huang , Fei Huang , Binyuan Hui , Shutong Jiang , Zhaohai Li , Mingsheng Li , Mei Li , Kaixin Li , Zicheng Lin , Junyang Lin , Xuejing Liu , Jiawei Liu , Chenglong Liu , Yang Liu , Dayiheng Liu , Shixuan Liu , Dunjie Lu , Ruilin Luo , Chenxu Lv , Rui Men , Lingchen Meng , Xuancheng Ren , Xingzhang Ren , Sibo Song , Yuchong Sun , Jun Tang , Jianhong Tu , Jianqiang Wan , Peng Wang , Pengfei Wang , Qiuyue Wang , Yuxuan Wang , Tianbao Xie , Yiheng Xu , Haiyang Xu , Jin Xu , Zhibo Yang , Mingkun Yang , Jianxin Yang , An Yang , Bowen Yu , Fei Zhang , Hang Zhang , Xi Zhang , Bo Zheng , Humen Zhong , Jingren Zhou , Fan Zhou , Jing Zhou , Yuanzhi Zhu , Ke Zhu

AdditiveLLM2: A Multi-modal Large Language Model for Additive Manufacturing

This work presents AdditiveLLM2 a multi-modal, domain adapted large language model built upon the instruction tuned variant of the Gemma 3 model using a relatively small dataset of around 50 million tokens. The dataset (AdditiveLLM2-OA)…

Machine Learning · Computer Science 2026-03-24 Peter Pak , Amir Barati Farimani

LLaMA: Open and Efficient Foundation Language Models

We introduce LLaMA, a collection of foundation language models ranging from 7B to 65B parameters. We train our models on trillions of tokens, and show that it is possible to train state-of-the-art models using publicly available datasets…

Computation and Language · Computer Science 2023-02-28 Hugo Touvron , Thibaut Lavril , Gautier Izacard , Xavier Martinet , Marie-Anne Lachaux , Timothée Lacroix , Baptiste Rozière , Naman Goyal , Eric Hambro , Faisal Azhar , Aurelien Rodriguez , Armand Joulin , Edouard Grave , Guillaume Lample

Multilingual Machine Translation with Open Large Language Models at Practical Scale: An Empirical Study

Large language models (LLMs) have shown continuously improving multilingual capabilities, and even small-scale open-source models have demonstrated rapid performance enhancement. In this paper, we systematically explore the abilities of…

Computation and Language · Computer Science 2025-02-25 Menglong Cui , Pengzhi Gao , Wei Liu , Jian Luan , Bin Wang