Publications

Zeren Chen, Gengshi Huang, Wei Li, Jianing Teng, Kun Wang, Jing Shao, Chen Change Loy, Lu Sheng (2023). Siamese DETR. CVPR.

PDF Code

Junting Pan, Ziyi Lin, Xiatian Zhu, Jing Shao, Hongsheng Li (2022). ST-Adapter: Parameter-efficient Image-to-Video Transfer Learning. NeurIPS.

PDF Code

Yuanhan Zhang, Qinghong Sun, Yichun Zhou, Zexin He, Zhenfei Yin, Kun Wang, Lu Sheng, Yu Qiao, Jing Shao, Ziwei Liu (2022). Bamboo: Building Mega-Scale Vision Dataset Continually with Human-Machine Synergy. CoRR.

PDF Cite Code Project

Yinan He, Gengshi Huang, Siyu Chen, Jianing Teng, Wang Kun, Zhenfei Yin, Lu Sheng, Ziwei Liu, Yu Qiao, Jing Shao (2022). X-Learner: Learning Cross Sources and Tasks for Universal Visual Representation. European Conference on Computer Vision (ECCV), 2022.

PDF Cite

Yuanhan Zhang, Zhenfei Yin, Jing Shao, Ziwei Liu (2022). Benchmarking Omni-Vision Representation through the Lens of Visual Realms. European Conference on Computer Vision (ECCV), 2022.

PDF Cite

Luya Wang, Feng Liang, Yangguang Li, Honggang Zhang, Wanli Ouyang, Jing Shao (2022). RePre: Improving Self-Supervised Vision Transformer with Reconstructive Pre-training. International Joint Conference on Artificial Intelligence (IJCAI), 2022.

PDF Cite DOI

Dong An, Zun Wang, Yangguang Li, Yi Wang, Yicong Hong, Yan Huang, Liang Wang, Jing Shao (2022). 1st Place Solutions for RxR-Habitat Vision-and-Language Navigation Competition (CVPR 2022). CoRR.

PDF Cite

Yubo Ma, Zehao Wang, Yixin Cao, Mukai Li, Meiqi Chen, Kun Wang, Jing Shao (2022). Prompt for Extraction? PAIE: Prompting Argument Interaction for Event Argument Extraction. Annual Meeting of the Association for Computational Linguistics (Volume 1: Long Papers) (ACL Long Papers), 2022.

PDF Cite Code DOI

Yubo Ma, Zehao Wang, Mukai Li, Yixin Cao, Meiqi Chen, Xinze Li, Wenqi Sun, Kunquan Deng, Kun Wang, Aixin Sun, Jing Shao (2022). MMEKG: Multi-modal Event Knowledge Graph towards Universal Representation across Modalities. Annual Meeting of the Association for Computational Linguistics: System Demonstrations (ACL Demo), 2022.

PDF Cite DOI

Meiqi Chen, Yixin Cao, Kunquan Deng, Mukai Li, Kun Wang, Jing Shao, Yan Zhang (2022). ERGO: Event Relational Graph Transformer for Document-level Event Causality Identification. CoRR.

PDF Cite

Haonan Qiu, Siyu Chen, Bei Gan, Kun Wang, Huafeng Shi, Jing Shao, Ziwei Liu (2022). Few-shot Forgery Detection via Guided Adversarial Interpolation. CoRR.

PDF Cite

Yufeng Cui, Lichen Zhao, Feng Liang, Yangguang Li, Jing Shao (2022). Democratizing Contrastive Language-Image Pre-training: A CLIP Benchmark of Data, Model, and Supervision. CoRR.

PDF Cite Project

Yangguang Li, Feng Liang, Lichen Zhao, Yufeng Cui, Wanli Ouyang, Jing Shao, Fengwei Yu, Junjie Yan (2022). Supervision Exists Everywhere: A Data Efficient Contrastive Language-Image Pre-training Paradigm. International Conference on Learning Representations (ICLR), 2022.

PDF Cite

Ruining Tang, Zhenyu Liu, Yangguang Li, Yiguo Song, Hui Liu, Qide Wang, Jing Shao, Guifang Duan, Jianrong Tan (2022). Task-Balanced Distillation for Object Detection. CoRR.

Cite

Junting Pan, Ziyi Lin, Xiatian Zhu, Jing Shao, Hongsheng Li (2022). ST-Adapter: Parameter-Efficient Image-to-Video Transfer Learning for Action Recognition. CoRR.

PDF Cite

Hao Wang, Yangguang Li, Zhen Huang, Yong Dou, Lingpeng Kong, Jing Shao (2022). SNCSE: Contrastive Learning for Unsupervised Sentence Embedding with Soft Negative Samples. CoRR.

Cite

Yuanhan Zhang, Yichao Wu, Zhenfei Yin, Jing Shao, Ziwei Liu (2022). Robust Face Anti-Spoofing with Dual Probabilistic Modeling. CoRR.

Cite

Yinan He, Lu Sheng, Jing Shao, Ziwei Liu, Zhaofan Zou, Zhizhi Guo, Shan Jiang, Curitis Sun, Guosheng Zhang, Keyao Wang, Haixiao Yue, Zhibin Hong, Wanguo Wang, Zhenyu Li, Qi Wang, Zhenli Wang, Ronghao Xu, Mingwen Zhang, Zhiheng Wang, Zhenhang Huang, Tianming Zhang, Ningning Zhao (2021). ForgeryNet - Face Forgery Analysis Challenge 2021: Methods and Results. CoRR.

PDF Cite

Teli Ma, Shijie Geng, Mengmeng Wang, Jing Shao, Jiasen Lu, Hongsheng Li, Peng Gao, Yu Qiao (2021). A Simple Long-Tailed Recognition Baseline via Vision-Language Model. CoRR.

PDF Cite Code

Zhao Zhong, Zichen Yang, Boyang Deng, Junjie Yan, Wei Wu, Jing Shao, Cheng-Lin Liu (2021). BlockQNN: Efficient Block-Wise Neural Network Architecture Generation. IEEE Transactions on Pattern Analysis and Machine Intelligence (IEEE T-PAMI), 2021.

Cite DOI

Yinan He, Bei Gan, Siyu Chen, Yichun Zhou, Guojun Yin, Luchuan Song, Lu Sheng, Jing Shao, Ziwei Liu (2021). ForgeryNet: A Versatile Benchmark for Comprehensive Forgery Analysis. IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR), Oral Presentation, 2021.

PDF Cite Dataset DOI

Junting Pan, Siyu Chen, Mike Zheng Shou, Yu Liu, Jing Shao, Hongsheng Li (2021). Actor-Context-Actor Relation Network for Spatio-Temporal Action Localization. IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR), 2021.

PDF Cite Code DOI

Bowen Yang, Jing Zhang, Zhenfei Yin, Jing Shao (2021). Few-Shot Domain Expansion for Face Anti-Spoofing. CoRR.

Cite

Yuyang Qian, Guojun Yin, Lu Sheng, Zixuan Chen, Jing Shao (2020). Thinking in Frequency: Face Forgery Detection by Mining Frequency-Aware Clues. European Conference on Computer Vision (ECCV), 2020.

PDF Cite DOI

Ronghao Guo, Chen Lin, Chuming Li, Keyu Tian, Ming Sun, Lu Sheng, Junjie Yan (2020). Powering One-Shot Topological NAS with Stabilized Share-Parameter Proxy. European Conference on Computer Vision (ECCV), 2020.

PDF Cite DOI

Kun Yuan, Quanquan Li, Jing Shao, Junjie Yan (2020). Learning Connectivity of Neural Networks from a Topological Perspective. European Conference on Computer Vision (ECCV), 2020.

PDF Cite DOI

Yuanhan Zhang, Zhenfei Yin, Yidong Li, Guojun Yin, Junjie Yan, Jing Shao, Ziwei Liu (2020). CelebA-Spoof: Large-Scale Face Anti-spoofing Dataset with Rich Annotations. European Conference on Computer Vision (ECCV), 2020.

PDF Cite Dataset Video DOI

Siyu Chen, Junting Pan, Guanglu Song, Manyuan Zhang, Hao Shao, Ziyi Lin, Jing Shao, Hongsheng Li, Yu Liu (2020). 1st place solution for AVA-Kinetics Crossover in AcitivityNet Challenge 2020. CoRR.

PDF Cite

Lu Sheng, Junting Pan, Jiaming Guo, Jing Shao, Chen Change Loy (2020). High-Quality Video Generation from Static Structural Annotations. International Journal of Computer Vision (IJCV), 2020.

PDF Cite Code DOI

Minghua Liu, Lu Sheng, Sheng Yang, Jing Shao, Shi-Min Hu (2020). Morphing and Sampling Network for Dense Point Cloud Completion. AAAI Conference on Artificial Intelligence (AAAI), 2020.

PDF Cite Code Dataset DOI

Zihao Wang, Chen Lin, Lu Sheng, Junjie Yan, Jing Shao (2020). PV-NAS: Practical Neural Architecture Search for Video Recognition. CoRR.

Cite

Xihui Liu, Guojun Yin, Jing Shao, Xiaogang Wang, Hongsheng Li (2019). Learning to Predict Layout-to-image Conditional Convolutions for Semantic Image Synthesis. Advances in Neural Information Processing Systems (NeurIPS), 2019.

PDF Cite Code Slides

Zihao Wang, Xihui Liu, Hongsheng Li, Lu Sheng, Junjie Yan, Xiaogang Wang, Jing Shao (2019). CAMP: Cross-Modal Adaptive Message Passing for Text-Image Retrieval. IEEE/CVF International Conference on Computer Vision (ICCV), 2019.

PDF Cite Code DOI

Junting Pan, Chengyu Wang, Xu Jia, Jing Shao, Lu Sheng, Junjie Yan, Xiaogang Wang (2019). Video Generation From Single Semantic Label Map. IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR), 2019.

PDF Cite Code DOI

Guojun Yin, Bin Liu, Lu Sheng, Nenghai Yu, Xiaogang Wang, Jing Shao (2019). Semantics Disentangling for Text-To-Image Generation. IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR), Oral Presentation, 2019.

PDF Cite DOI

Xihui Liu, Zihao Wang, Jing Shao, Xiaogang Wang, Hongsheng Li (2019). Improving Referring Expression Grounding With Cross-Modal Attention-Guided Erasing. IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR), 2019.

PDF Cite Code DOI

Guojun Yin, Lu Sheng, Bin Liu, Nenghai Yu, Xiaogang Wang, Jing Shao (2019). Context and Attribute Grounded Dense Captioning. 2019 IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR).

PDF Cite DOI

Lu Sheng, Junting Pan, Jiaming Guo, Jing Shao, Xiaogang Wang, Chen Change Loy (2019). Unsupervised Bi-directional Flow-based Video Generation from one Snapshot. CoRR.

Cite

Yongcheng Liu, Lu Sheng, Jing Shao, Junjie Yan, Shiming Xiang, Chunhong Pan (2018). Multi-Label Image Classification via Knowledge Distillation from Weakly-Supervised Detection. ACM International Conference on Multimedia (MM), 2018.

PDF Cite Code DOI

Xihui Liu, Hongsheng Li, Jing Shao, Dapeng Chen, Xiaogang Wang (2018). Show, Tell and Discriminate: Image Captioning by Self-retrieval with Partially Labeled Data. European Conference on Computer Vision (ECCV), 2018.

PDF Cite DOI

Yu Liu, Guanglu Song, Jing Shao, Xiao Jin, Xiaogang Wang (2018). Transductive Centroid Projection for Semi-supervised Large-Scale Recognition. European Conference on Computer Vision (ECCV), 2018.

PDF Cite DOI

Pengze Liu, Xihui Liu, Junjie Yan, Jing Shao (2018). Localization Guided Learning for Pedestrian Attribute Recognition. British Machine Vision Conference (BMVC), 2018.

PDF Cite

Zhao Zhong, Junjie Yan, Wei Wu, Jing Shao, Cheng-Lin Liu (2018). Practical Block-Wise Neural Network Architecture Generation. IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR), Oral Presentation, 2018.

Cite DOI

Yu Liu, Fangyin Wei, Jing Shao, Lu Sheng, Junjie Yan, Xiaogang Wang (2018). Exploring Disentangled Feature Representation Beyond Face Identification. IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR), 2018.

PDF Cite DOI

Lu Sheng, Ziyi Lin, Jing Shao, Xiaogang Wang (2018). Avatar-Net: Multi-scale Zero-Shot Style Transfer by Feature Decoration. IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR), 2018.

PDF Cite Code Project DOI

Guojun Yin, Lu Sheng, Bin Liu, Nenghai Yu, Xiaogang Wang, Jing Shao, Chen Change Loy (2018). Zoom-Net: Mining Deep Feature Interactions for Visual Relationship Recognition. European Conference on Computer Vision (ECCV), 2018.

PDF Cite DOI

Dapeng Chen, Hongsheng Li, Xihui Liu, Yantao Shen, Jing Shao, Zejian Yuan, Xiaogang Wang (2018). Improving Deep Visual Representation for Person Re-identification by Global and Local Image-language Association. European Conference on Computer Vision (ECCV), 2018.

PDF Cite DOI

Zhongdao Wang, Luming Tang, Xihui Liu, Zhuliang Yao, Shuai Yi, Jing Shao, Junjie Yan, Shengjin Wang, Hongsheng Li, Xiaogang Wang (2017). Orientation Invariant Feature Embedding and Spatial Temporal Regularization for Vehicle Re-identification. IEEE International Conference on Computer Vision (ICCV), 2017.

PDF Cite DOI

Xihui Liu, Haiyu Zhao, Maoqing Tian, Lu Sheng, Jing Shao, Shuai Yi, Junjie Yan, Xiaogang Wang (2017). HydraPlus-Net: Attentive Deep Features for Pedestrian Analysis. IEEE International Conference on Computer Vision (ICCV), 2017.

PDF Cite Code DOI

Haiyu Zhao, Maoqing Tian, Shuyang Sun, Jing Shao, Junjie Yan, Shuai Yi, Xiaogang Wang, Xiaoou Tang (2017). Spindle Net: Person Re-identification with Human Body Region Guided Feature Decomposition and Fusion. IEEE Conference on Computer Vision and Pattern Recognition (CVPR), 2017.

PDF Cite Code Dataset DOI

Jing Shao, Chen Change Loy, Xiaogang Wang (2017). Learning Scene-Independent Group Descriptors for Crowd Understanding. IEEE Transactions on Circuits and Systems for Video Technology (IEEE T-CSVT), 2017.

Cite DOI

Jing Shao, Chen Change Loy, Kai Kang, Xiaogang Wang (2017). Crowded Scene Understanding by Deeply Learned Volumetric Slices. IEEE Transactions on Circuits and Systems for Video Technology (IEEE T-CSVT), 2016.

Cite DOI

Jing Shao, Chen Change Loy, Kai Kang, Xiaogang Wang (2016). Slicing Convolutional Neural Network for Crowd Video Understanding. IEEE Conference on Computer Vision and Pattern Recognition (CVPR), Spotlight, 2016.

Cite DOI

Jing Shao, Kai Kang, Chen Change Loy, Xiaogang Wang (2015). Deeply learned attributes for crowded scene understanding. IEEE Conference on Computer Vision and Pattern Recognition (CVPR), Oral Presentation, 2015.

PDF Cite DOI

Jing Shao, Chen Change Loy, Xiaogang Wang (2014). Scene-Independent Group Profiling in Crowd. IEEE Conference on Computer Vision and Pattern Recognition (CVPR), Oral Presentation, 2014.

PDF Cite DOI