黄双萍,女,博士,教授,博导。现在华南理工大学电子与信息学院深度学习及视觉计算团队从事教学科研工作,主要涉及场景文本检测和识别,智能文档分析,计算机视觉,深度学习,机器学习等相关领域的理论及应用研究等。任中国图象图形学会文档分析与识别专委会委员,广东省图象图形学会理事,广东省图像图形学学会“计算机视觉”专业委员会委员。主持2项国家自然科学基金面上项目“基于深度强化学习和路径积分特征图的自然场景文本检测与识别”和“基于图卷积和域自适应的跨场景复杂版面分析算法”,主持2项广东省自然科学基金项目“文档图像版面结构分析算法研究”,主持1项广东省科技计划公益专项、主持1项广州市科创委基础研究项目,和企业共同主持1项广州市人工智能重点专项(1000万元),与中通服联合主持1项广州市科技计划产业技术重大攻关计划,主持重点实验室项目“面向教育场景的图文识别智能标注系统”,主持1项与阿里巴巴达摩院科技有限公司的横向项目(面向教育场景的拍照题目及手写答案识别技术研究),主持1项与时代软件公司的横向项目(表单和标志牌信息智能识别),主持1项与华南农业大学合作研究的国家自然科学基金项目(作为合作方的项目负责人),主持1项河南省甲骨文信息处理重点实验室开放基金项目1项,主持2项甲骨文信息处理教育部重点实验室开放课题(基于GAN的甲骨拓片字符生成与识别技术、基于对抗生成和域自适应的甲骨拓片字符识别技术)。先后以课题骨干参与科技创新2030-“新一代人工智能”重大项目,广东省自然科学基金研究团队项目等。最近5年,积累的研究成果在Information Sciences、Pattern Recognition,Neurocomputing,ACM等国外期刊和国际会议上发表SCI/EI论文30 余篇,提交/受理/公开发明专利23件。获得“广东省科学技术奖励二等奖”1项,吴文俊人工智能科技进步奖1项。指导学生荣获:第六届互联网+大学生创新创业大赛国赛金奖,2017年挑战杯广东省特等奖”,第二届中国模式识别与计算机视觉大会面向自动阅卷的OCR技术挑战赛文字识别任务一等奖,中国创新挑战赛智慧教育专题赛三等奖(教育手写公式识别)。 (1)主持:基于图卷积和域自适应的跨场景复杂版面分析算法,国家自然科学基金,2022年1月~2025年12月,58万元(直接经费);
(2)主持:基于深度强化学习和路径积分特征图的自然场景文本检测与识别,国家自然科学基金,2017年1月~2020年12月,78万元;
(3)主持:面向教育场景的图文识别智能标注系统,省级基础研究项目,2021年5月~2023年5月,80万
(4)与企业联合申报,华工主持:高精度全要素身份融合识别与解析关键技术研究,广州市人工智能重点专项(2022),2022年4月~2025年3月,200万/1000万
(5)主持:文档图像版面结构分析算法研究,广东省基础与应用基础研究基金项目,2021年1月~2023年12月,10万元;
(6)主持:场景文本检测和识别算法研究及应用,广州市科技计划,2017年5月~2020年4月,20万元;
(7)与中通服联合申报,华工主持:移动通信高价值用户与场景的智能识别技术及应用系统研发,广州市科技计划产业技术重大攻关计划(2019),2019年4月~2021年3月,40万/200万
(8)主持:表单及标志牌信息智能识别,时代软件公司,2021年6月~2023年6月,200万元
(9)主持:面向教育场景的拍照题目及手写答案识别研究,阿里巴巴达摩院(杭州)科技有限公司,2020年7月~2021年6月,50万元
(10)主持:基于生成对抗网络(GAN)的甲骨拓片字符生成与识别技术,2019年12月~2020年12月,甲骨文信息处理教育部重点实验室课题
(11)主持:基于对抗生成和域自适应的甲骨文拓片字符识别技术,2021年5月~2023年5月,甲骨文信息处理教育部重点实验室课题
(12)主持:水稻穗瘟抗性高光谱鉴定技术研究及示范,项目编号:2014A020208112, 广东省科技计划公益专项,2015年1月~2017年12月,20万元;
(13)主持:视觉感知的水稻株间机械除草与同步液肥环施机理研究,项目编号:51575195, 国家自然科学基金,2016年1月~2019年12月,20 of 74万元(合作研究);
(14)主要参与:智能感知与视觉感知计算,项目编号:2017A030312006,广东省自然科学基金研究团队项目,2017年5月~2022年5月,到校经费额度:150万元 [1] Zhenghua Peng, Yu Luo, Tianshui Chen, Keke Xu, Shuangping Huang, Perception and Semantic Aware Regularization for Sequential Confidence Calibration, CVPR 2023,CCF A, Accepted
[2] Gang Dai, Yifan Zhang, Qingfeng Wang, Qing Du, Zhuliang Yu, Zhuoman Liu, Shuangping Huang, Disentangling Writer and Character Styles for Handwriting Generation, CVPR 2023,CCF A, Accepted
[3] FanYang, LeiHu, Shuangping Huang*, A large-scale dataset for end-to-end table recognition in the wild, Scientific Data, 2023(IF=8.501,JCR Q1)
[4]  Shuangping Huang, Zhuoyao Zhong, Lianwen Jin, Shuye Zhang, Haobin Wang, DropRegion Training of Inception Font Network for High-Performance Chinese Font Recognition, Pattern Recognition,77: 395-411, 2018(IF=7.196,JCR Q1)
[5]  Shuangping Huang, Lianwen Jin, Kunnan Xue, Yuan Fang, Online Primal-dual Learning for a Data-dependent Multi-kernel Combination Model with Multi-class Visual Categorization Applications, Information Sciences,320: 75-100, 2015(IF=5.910, JCR Q1)
[6] Haojie Li, Daihui Yang, Shuangping Huang*, Kin-Man Lam, Lianwen Jin, Two-Dimensional Multi-Scale Perceptive Context for Scene Text Recognition, Neurocomputing, 41: 410-421, 2020 (IF=4.438, JCR Q1);
[7]  Ziyong Feng, Zhaoyang Zhao, Lianwen Jin, Shuangping Huang*, Robust shared feature learning for script and handwritten/machine-printed identification, Pattern Recognition Letters,2017(IF=3.255, JCR Q2)
[8] Hongxiang Huang, Daihui Yang, Shuangping Huang, AGTGAN: Unpaired Image Translation for Photographic Ancient Character Generation, ACM MM 2022,CCF A, Accepted
[9] Haojie Li, Daihui Yang, Shuangping Huang*, Kin-Man Lam, Deep Motion-Appearance Convolutions for Robust Visual Tracking, IEEE ACCESS, 2019(IF=3.7,JCR Q1)
[10]  Huang Shuangping, Qi Long, Ma Xu, Xue Kunnan, Wang Wenjuan, Zhu Xiaoyuan, BoSW Model Based Hyperspectral Image Analysis for Rice Panicle Blast Grading, Computers and Electronics in Agriculture, 118: 167-178, 2015(IF=3.858,JCR Q1)
[11]  Huang Shuangping, Qi Long, Ma Xu, Xue Kunnan, Wang Wenjuan, Zhu Xiaoyuan, Deep localization model for intra-row crop detection in paddy field, Computers and Electronics in Agriculture, 169: 1-12, 2019(IF=3.858,JCR Q1)
[12]  Shingling Huang, Lianwen Jin, Yuan Fang, Xiaoxin Wei, Online Heterogeneous Feature Fusion Machines for Visual Recognition, Neurocomputing, 123(10): 100-109, 2014 (IF=4.438, JCR Q1);
[13]  Shuangping Huang, Lianwen Jin, Yunyu Li, Kunnan Xue, Long Qi, Online Multi-kernel Learning Based on a Triple Norm Regularizer for Semantic Image Classification, Mathematical Problems in Engineering,2015(IF=1.145,JCR Q3).
[14] Zhenzhou Zhuang, Zonghao Liu, Shuangping Huang, A New Semi-Automatic Annotation Model for Text Detection via Semantic Boundary Estimation, ICDAR 2021
[15] Shuangping Huang, Yu Luo, Zhenzhou Zhuang, Context-Aware Selective Label Smoothing for Calibrating Sequence Recognition Models, ACM MM 2021, CCF A, Accepted
[16] Jinrong Li, Zijian Zhou, Zhizhong Su, Shuangping Huang, Lianwen Jin, A New Parallel Detection-Recognition Approach for End-to-End Scene Text Extraction, ICDAR 2019
[17] Shuangping Huang, Haobin Wang, Yongge Liu, Xiaosong Shi, Lianwen Jin, OBC306: A Large-Scale Oracle Bone Character Recognition Dataset, ICDAR 2019
[18] Haobing Wang, Shuangping Huang*, Lianwen Jin, Focus on Scene Text Using Deep Reinforcement Learning, ICPR 2018 (1) 黄双萍,王浩斌,金连文,基于深度强化学习的场景文本检测方法及系统,申请号: 201711352220.0, 2017,已发授权通知书(2020年8月4日)
(2) 黄双萍,武思航,李豪杰,基于双流卷积神经网络的目标跟踪方法、系统、设备及介质,授权号: CN109410242A,2020
(3) 黄双萍,郑锐佳等,文本图像标注系统、方法、计算机设备和存储介质,申请号:202010548848.3
(4) 黄双萍,杨代辉等,拓片甲骨文字符图像增广方法、系统、计算机设备及介质,申请号:202010553556.9
(5) 黄双萍,武思航,李豪杰,基于三维卷积神经网络的边界框回归方法、系统、设备及介质,授权号: CN109255351A,2019
(6) 黄双萍,庄镇州等,文本识别方法、装置、计算机设备和存储介质,申请号:202010469514.7
(7) 黄双萍,齐龙等,基于深度卷积神经网络的水稻穗瘟检测方法及系统,专利号: ZL 2017 1 0595555.9, 2020
(8) 黄双萍,金连文等,基于BLSTM的联机手写数学公式符号识别方法,申请号:ZL 2015 1 0860618.X,2019
(9) 金连文,黄双萍等,一种基于样本模板的数字化妆方法,申请号:ZL 2015 1 0860633.4,2019
(10) 黄双萍, 金连文等,一种基于多重网格近似算法的自适应区域感知蒙板生成方法,申请号:ZL 2015 1 0869819.6,2019
(11) 黄双萍,金连文等,一种基于改进的引导滤波器的人脸图像图层分解方法,公开号:CN105469407B,2018
(12) 黄双萍,杨代辉等,复杂场景文本识别方法、系统、计算机设备及存储介质,申请号:202010919026.1
(13) 黄双萍,刘宗昊等,图像文本检测半自动标注方法、系统、计算机设备及介质,申请号:202110906651.7 本科课程:数字信号处理
研究生课程:深度学习 指导学生情况 1、识古通今-OCR 技术领航者,第六届中国国际“互联网+”大学生创新创业大赛的国赛金奖,2020
2、基于深度学习的自然场景文本检测,第十四届“ 挑战杯” 广东大学生课外学术科技作品竞赛,自然科学类学术论文组,特等奖,2017
3、第二届中国模式识别与计算机视觉大会面向自动阅卷的OCR技术挑战赛文字识别任务一等奖,2019
4、教育手写公式识别,中国创新挑战赛智慧教育专题赛三等奖,2020
5、基于深度学习的图像文字识别,2018年大学生创新创业训练计划项目优秀结题 华南理工大学电信学院“深度学习与视觉计算团队”现有教授3人,副教授4人,副研究员1人。团队致力于人工智能、计算机视觉、模式识别领域的前沿理论技术的研究及创新应用,主要研究方向包括深度学习、人工智能、文字识别、文档图像分析与识别、图像及视频处理、人体运动行为分析与理解等。团队近年来先后主持了国家及省部级科研项目30余项,在光学字符识别(OCR)、手写识别、手势识别及交互技术、深度学习创新应用等方面取得了不少国际国内领先的研究成果,发表SCI/EI论文200余篇,获得授权发明专利近50项,获得省部级科技奖5次,国际学术竞赛第一名3次。部分研究成果曾先后与微软、三星、富士通、腾讯、搜狗、科大讯飞、江苏卫视等知名企业合作。