BloomBerry.ai

[MM] VisionZip: Longer is Better but Not Necessary in Vision Language Models

1 minute read

[MM] VisionZip: Longer is Better but Not Necessary in Vision Language Models

2 minute read

[OD] CoDETR: DETRs with Collaborative Hybrid Assignments Training

1 minute read

[MM] Eyes Wide Shut? Exploring the Visual Shortcomings of Multimodal LLMs

2 minute read

[MM] Dense Connector for MLLMs

1 minute read

[Layout] VLT: Interactively Optimizing Layout Transfer for Vector Graphics