苏h8a939车牌在上海2o13k经典电影网年违章记录

维生素 | 脱发 | 流感 | 历史人物 | 茂名市 | 饮食 | 哲学 | 仓鼠 | 咖啡 | 奶茶 | 汽车设计 | 大学生 | 九龙 | 面相 | 狐臭 | 鲜奶 | 机箱 | 强迫症 | 宝洁（P&G） | 动物 | 莎车县 | 乳腺癌 | 医患关系 | 翡翠 | 江苏省 | 语言 | 电脑硬件 | 骊威 | 燕窝 | 酒文化 | 医学生 | 汽车维修 | 大脑 | 大白菜 | 高血压 | 电视 | 云计算 | 骨折 | 伊宁市 | 食品 | 地图 | 实木家具 | 冬虫夏草 | 过敏性鼻炎 | 太湖县 | 眼科学 | 历史 | 南京市 | 呼和浩特市 | 上火 | 猪瘟 | 医疗行业 | 异性朋友 | 编程 | 酵素 | 内黄县 | 同学聚会 | 男闺蜜 | 赛欧 | 厦门市 | 柠檬 | 佛教 | 自卑 | 礼仪 | 骨科 | 牙齿矫正 | 企业 | 中国文学 | 鲤鱼 | 服装面料 | 红酒 | 案件 | 视力保健 | 痛风 | 绝地求生大逃杀 | 坐月子 | 美国 | 房价 | 鸡蛋 | 洗发水 | 铜仁市 | 口臭 | 室友关系 | 辐射危害 | 徽州区 | 米粉 | 天花 | 演出 | 三菱商事 | 混凝土 | 螃蟹 | 高二 | 情商 | 初恋 | 前任恋人 | 粉丝（Fans） | 情绪管理 | 滦州市 | 进贤县 | 父亲 | 儿童教育 | 鸭绿江 | 疾病 | 新疆维吾尔自治区 | 大学生活 | 抚顺市 | 社交网络 | 萧炎 | 奶粉 | 周易 | 湿疹 | 微信朋友圈 | 大城县 | 生物材料 | 刷机 | 研究生 | 牛初乳 | 牛肉 | 巧克力 | 泾川县 | 电路 | 练字 | 姓氏 | 考研 | 八字算命 | 工资 | 汉服 | 约会 | 城市规划 | 埇桥区 | 祁县 | 记忆力 | 胶州市 | 非洲 | 杨凡 | 王者荣耀 | 烤瓷牙 | 罗兰 | 卡通 | 化疗 | 武冈市 | 医学常识 | 日本 | 产后护理 | 淇县 | 实验 | 家庭暴力 | 手工艺 | 亲子鉴定 | 电动汽车 | 头晕 | 延安 | 人体 | 卫生巾 | 微生物 | 奇瑞 | 视频剪辑 | 酒店 | 空气质量 | 蔬菜 | 彬州市 | 发动机 | 名言 | 室友 | 植物 | 前端开发 | 大红袍 | 华为手机 | 植发 | 显卡 | 孕妇 | 鸡尾酒 | 白血病 | 床垫 | 艾灸 | 汤品 | 维生素c | 创业 | 抑郁 | 麦克风 | 科学技术 | 新风系统 | 辣椒 | 女生爱情 | 余杭区 | 情感专家 | 公路车 | 孤岛惊魂（游戏） | 网站 | 职场沟通 | 博物馆 | 韭菜 | 羊 | 民族 | 调酒 | 五菱宏光s | 院校信息 | 西宁市 | 白兰地 | 餐饮 |

你的位置：网站首页 >> 频道首页 >>违章 >>苏h8a939车牌在上海2o13k经典电影网年违章记录

苏h8a939车牌在上海2o13k经典电影网年违章记录

来源：蜘蛛抓取(WebSpider) 时间：2016-06-26 14:39 标签：三星2o13主板多少钱

车辆牌照识别系统的研究_伤城文章网
车辆牌照识别系统的研究
北京服装学院硕士学位论文车辆牌照识别系统的研究姓名：李保平申请学位级别：硕士专业：机械电子工程指导教师：韩润萍
北京服装学院硕士学位论文车辆牌照识别系统的研究摘要由于智能交通管理的迫切需要，车辆牌照识别系统应运而生。目前它已成为机器视觉和人工智能领域中的一个研究热点，众多企业和研发机构相继展开了这方面的研究。本文主要研究了车辆牌照识别系统中车牌字符分割、特征提取以及字符识别等关键技术。首先对车牌照图像进行了预处理，在此基础上结合车牌字符特点，使用投影变换的方法完成了车牌字符分割。其次综合提取了车辆牌照字符的统诗特征与轮廓特征。然后研究了基于Ｂｐ神经网络和基于支持向量机（ＳｖＭ）的两种字符分类算法，设计了相应的分类器，实现了字符识别。最后对字符识别系统进行仿真，结果表明该系统对车牌照字符具有较好识别效果。关键词：车牌照识别，特征提取，分类器，神经网络，ＳⅥ订北京服装学院硕士学位论文ＲＥＳＥＡＲＣＨｏＮＶＥＨＩＣＬＥＬＩＣＥＮＳＥＰＬＡＴＥＲＥＣｏＧＮＩＴＩｏＮＳＹＳＴＥＭＡＢＳＴＲＡＣＴＢｅｃａｕ辩ｏｆｔｈｅｕｒｇｃｍｎｅｅｄｏｆｉｎｔｅｌｌｉｇｅｎｔｔｒａｍｃ，ｔｈｃｖｅＩｌｉｃｌｅｌｉｃｅｎｓｅｐｌａｔｅｓｙｓｔｅｆｎｉｓｄｃＶｅｌｏｐ。ｄ．―Ｌｔｐ陀ｓｃｎｔ，ａｒｅｃｏｇＩｌｉｔｉｏｎ（ＬＰＲ）ａｇｒｏ响ｇｎ啪ｂｅｒｏｆｅ１１ｔｃｌｐｒｉｓｅｓ拙ｄＲ＆ＤｉｎｓｔｉｔｌｌｔｉｏＩｌｓｐａｙ１０ｔｏｆａ蹴ｍｉｏ鹏０ｎｔｈｃＬＰＲｓ）ｒｓｔｃ：ＩＩｌｒｅｓｅ虮札州ｃｈｉｓｈｏｔｓＩ斌ｉｎｔｌｌｅｆｉｅｌｄｏｆｍａｃＩｌｉｎｅｖｉｓｉｏｎ觚ｄａａｎｉｆｉｃｉａｌｉｎｔｅｌｌｉｇｅｎｃｃ．ｈｔｌｌｅｔｈｅｓｉｓ，ｌｈｅｃｈａ豫ｎｅｒａｒｃｓｃｇｍｅｎ枷ｏｎ，ｆｅａｔｔＩｒｅｅｘ协重ｃｔｉｏｎ锄ｄｃｂａｒａｃｔｃｒｒｅｃｏ鲥ｔｉＤ如嘶１１ｉｃｈｋｃｙｔｅｃｈｎｏｌｏｇｉｅｓ０ｆｔｈｅＵ）Ｒｓｙｓｔｅｍ，ａｒｅｒｃ∞ａｒｃｈｃｄ．Ｆｉｒｓｔｌｙ’ｔｌｌｅｃｈａｒａｃｔ盯∞ｇＩｎｅＩｌｔａｔｉｏｎｏｆｍｃｐｒ印∞ｃｅｓｓｅｄｂａｓｃｄｏｎｔｌｌｅｃｈａｒ删ｓｔｉｃｓＶｅｈｉｃｌｃｌｉｃｅｎ∞ｐＩａｔｅｉｍａｇｅｉｓｃｏｍｐｌ鼬ｃｄ谢ｔｌｌｔｈｅｐｒｏｊｅｃｔｉｏｎ乜柚ｓｆｏｍｌａｔｉｏｎｍｅｔｌｌｏｄａｒｅｏｆｔ１１ｅｖｅｔｌｉｃｌｅｌｉｃｅｍｅｃｈａｆａｃｔｃｒｓ．Ｓｅｃｏｎｄｌｙ，ｔｌＩｅｃｈａｍｃｔｃｒｆｅ曲ｌｒｅｓｃｏｎｔｏｌｌｒｃ】（饥ｂ删，ｗＩｌｉｃｈｃｏｍｂｉｎｅｓｔｈｅｓｔａｔｉｓｔｉｃａｌｆ妇ｔＩｌｒｃｓａｎｄｍａｃｈｍ（ＳＶＭ）缸ｅａ１１ａｌｙｚｅｄ，柚ｄｍｅｆｅ批ｓｏｆｔｈｅｖｅｌｌｉｃｌｅｌｉｃｅｎＳｅｐｌａ钯．Ｉ协ｌ＆ｃｌａｓｓｉ＆ａｔｉｏｎａ１９０谢眦ｏｆｍｅＢＰｎｅＩ蝴ｌ删ｗｏｒｋ（ＢＰＮＮ）勰ｗｅｌｌ觞ｔｈｅｓ叩ｐｏｒｔｖｅｃ研ｄｅｓｉｇｎｃｄ，州ｃｈｆｉｌｌａｌｌｙ浏ｉｚｅｓｔｈｅｃｈａｆａｃ锄。ｒｅｃｏｇｎｉｔｉｏｎ．Ｓｉｍｕｌａｔｉｏｎｏｆｔｌｌｅｄ唧∞衄’ｒｅｃｏ蛳ｔｉｏｎｓｙｓｔｅｍｉｓｐ曲ｍｅｄ，ｃｏ盯ｃｓｐｏｎｄ堍ｃｌａＳｓｉｆｉｅｒｓａｒｅ越ｌｄｔｈｅｒｅｓｌｌｌｔｓｃｈ砌．ａｃｔｅ陪．ｉｎｄｉｃａｔｅｍａｔｍｅｓｙｓｔｃｍｈ勰ｇｏｏｄｒｃｃｏｇ出ｔｉｏｎｅ珏毫ｃｔｓｍｌ１嘴ｌｌｉｃｌｅｌｉｏｃｎ辩ＫＥＹＷＯＲＤＳ：ＬＰＲ，Ｆｅａｔｕ代Ｅｘｔｍｃ“ｏｎ，ＣＩａｓｓｉ６ｅｂＮ蛐ｒａＩＮｅｔｗｏｒＩ‘，ＳＶＭＩＩ原创性声明本人郑重声明：所呈交的学位论文，是本人在导师的指导下，独立进行研究工作所取得的成果。除文中已经注明引用的内容外，本论文不含任何其他个人或集体已经发表或撰写过的作品成果。对本文的研究做出重要贡献的个人和集体，均已在文中以明确方式标明。本人完全意识到本声明的法律结果由本人承担。学位论文作者签名：亏孵签字臼期：力ｐ７年瑚胆日学位论文版权使用授权书学位论文作者完全了解北京服装学院有关保留和使用学位论文的规定，即：研究生在校攻读学位期间论文工作的知识产权单位属北京服装学院。学校有权保留并向国家有关部门或机构送交论文的复印件和磁盘，允许学位论文被查阅和借阅：学校可以公布学位论文的全部或部分内容，可以允许采用影印、缩印或其它复制手段保存、汇编学位论文。（保密的学位论文在解密后适用本授权书）学位论文作者签名：撕签字日期：力Ｐ７年，２月／２日学位论文作者毕业后去向工作单位：通讯地址：剔磁名’砰｝闰珲签字日期：上－ｐ７年ｆｚ月，ｚ日电话：邮编：北京服装学院硕士学位论文第一章绪论１．１课题研究的意义和背景当今社会已进入信息时代，随着计算机技术、通信技术以及人工智能技术的发展，自动化信息处理能力得到前所未有的发展和提高，并在人们的社会生活以及生产中起到越来越重要的作用。在这种情况下，作为信息来源的自动检测、图像处理以及机器视觉等技术日益受到人们的高度关注。另一方面，随着中国国民经济的发展，汽车拥有量呈持续快速增长的态势，据权威部门预测，到２０１０年，我国汽车产量将达到８００万辆，届时机动车拥有量达将到１．３亿辆之多。汽车数量的增加，带来了交通拥堵、交通事故、环境污染、社会效率低下等一系列问题。为了解决因交通快速发展所引发的各种问题，智能交通系统（Ｉｎｔｅｌｌｉｇ蚰ｃｅＴｒ纽ｓｐｏｎ撕ｏｎｓｙｓｔｅＩｎ，简称ｌＴｓ）的研究被提到了重要位置。近年来，ＩＴＳ在中国有了长足的发展Ｉ”。１９９９年，由科技部牵头，联合建设部、交通部、公安部等多个相关部委，组织成立了全国智能交通系统（ＩＴＳ）协调小组，为推动交通系统的智能化发展提供了组织机制保障。２０００年，完成了中国ＩＴＳ体系框架研究和标准规范的制定。“十五”期间，科技部将ｒｒＳ作为科技规划的重大专项项目予以实施，并将以示范工程为弓ｌ导。加快技术开发与产业化，促进相关技术的全面发展。目前，国内已经涌现出一批Ⅱｓ的科技成果和产品，有些已经得到了广泛的应用。一些国有大企业、上市公司、民营企业纷纷看好ｒｒＳ领域，大量投入资金、人力和物力。而车牌照识别（Ｌｉ咖ｓｃＰｌａｔｅＲｃｃｏ鲥６０ｎ，简称ＬＰＲ）作为ｎ’ｓ的核心嘲，起着举足轻重的作用，它在高速公路、城市道路和停车场等项目管理中占有重要地位。ＬＰＲ系统研究内容涉及到图像的实时采集、处理和分析，是一个综合的计算机视觉系统ｐ－４】。它跨越了数学、计算机科学、自动化技术以及电子信息工程技术等多个学科，不仅与人工智能、神经网络、遗传算法、模糊逻辑等多种理论密切相关，而且和数学、计算机科学、物理学、神经生理学、电子学等许多的学科相互借鉴。它的发展可应用于生物医学、交通管理、遥感、通信、军事侦察、工业自动化等许多的领域。因此作为智能交通的重要组成部分，ＬＰＲ技北京服装学院硕士学位论文术的发展不仅能大大加快ＩＴｓ进程，而且有着更为广泛的应用价值。ＬＰＲ在以下几种场合有着广泛应用：（１）高速公路收费和小区停车场收费在高速公路以及小区，实现不停车收费，提高交通道路的畅通性。尤其对于高速公路，在收费出入口完成车牌照号码识别和车牌照匹配工作，可以及时发现车辆的换卡行为，收费员的舞弊行为，规范收费程序。（２）交通道路监控和车辆追踪建立公路布控系统，采用车牌照识别技术，实现对重点车辆的自动识别、快速报警处理。不仅可以有效防止机动车辆被盗，而且为公安、监察机关对犯罪嫌疑人所驾车辆的自动监控和跟踪提供了高科技手段。（３）车流统计和智能交通管理在主要交通路口设立监控站点，根据实时车流量调整红绿灯的通行时间，以此提高交通运行的效率。目前北京等一些城市的主交通路口已有该系统的应用，并且取得了良好的交通疏导效果。１．２国内外研究现状１．２．１ＬＰＲ系统的研究概况在国外，车牌照自动识别的研究最早出现于上世纪ｇＯ年代，这个阶段的研究还没有形成完整的系统体系，而是就车牌照识别中的某一个具体问题进行讨论。通常是采用简单的图像处理技术来解决。识别过程是使用工业电视摄像机（１ｎｄｕｓ岫ａｌＴＶＣａＩｌｌｅｒａ）拍摄汽车的正前方图像，然后交给计算机进行简单处理，最终仍需要人工干预。进入９０年代，由于计算机视觉技术（ｃｏｍｐｕｔｃｒｖｉｓｉｏｎＴｅｃｌｌＩｌｉｑｕｅ）的发展，ＬＰＲ系统已趋近成熟吼车牌照识别率可达到９５％以上。例如以色列的Ｈｉ．Ｔｅｃｈ公司研制的Ｓｅｅ圮ａｒｓｙｓｔｅｍ，新加坡的Ｏｐｔａｓｉａ公司研制的ｖＬＰＲＳＨ系统等。国内的ＬＰＲ的研究到９０年代才刚刚开始，起步较晚，总体上说我国汽车牌照识别还处于研究阶段，用于实际的系统还不多。已有的部分用于实际的系统。车牌照识别率也仅达到９０％左右。识别时间在Ｏ．５～１秒之间。目前，国内使用比较多的有中科院自动化所２北京服装学院硕士学位论文汉王公司的“汉王眼”，浙江大学的“车牌通”，香港的舡ｉａＶｉｓｉｏｎ１Ｋ１１Ｉｌｏｌｏｇ）ｒ的ＶＥＣＯＮ等。另外中科院沈阳自动化所的沈阳聚德公司，深圳市吉通电子有限公司，中国信息产业部下属的中智交通电子有限公司等也都有自己的产品。同时国内许多重点大学和科研院所也纷纷开展相关研究．１．２．２ＬＰＲ关键技术的研究就ＬＰＲ系统的关键技术而言，包括车牌照定位以及车牌照字符识别两个部分。车牌照定位，它的任务是从一幅含有车牌照的图像中，准确建找到其牌照区域，它是ＬＰＲ系统处理流程的第一步，是后续车牌照字符识别的基础。现在定位效果比较好的方法主要有，根据车牌照颜色信息进行定位Ｉ”，基于车牌照区域形态学分析ｆｓｌ，以及根据车牌照位置投影信息定位方法１９ｌ等。车牌照字符识别包括汉字、英文字母和数字的识别技术，一般来说车牌照字符识别问题属于印刷体字符的识剐阕题【１０１，但是由于受噪声等情况的影响，实际得到的车牌照图像中的字符常常出现噪声、笔画断裂、字体模糊、形状相似的情况，因此使用传统的印刷体字符识别方法难以得到满意的效果。目前用于车牌照字符识别的主要方法有：统计决策、结构模式识别、模板匹配、人工神经元网络等模式分类方法Ｉｌｌ－”】．（１）统计决策法统计决策以概率论和数理统计为基础，它包括参数方法和非参数方法。参数方法主要以贝叶斯决策准则为指导，其中最小错误率和最小风险贝叶斯决策是最常用的两种决策方法。在贝叶斯决策的基础上，根据各种错误决策造成损失的不同，人们提出基于贝叶斯风险的决策。实际上对于具体的模式识别问题，先验概率和类条件概率密度很难精确知道ａ图像处理往往与图像的结构信息有关，因此对于很复杂的图像，采用统计决策的方法很难实现其分类。（２）结构模式识别结构模式识别是利用模式的结构描述与句法描述之间的相似性对模式进行分类。每个模式由它的各个子部分（称为子模式或模式基元）的组合来表示。对模式的识别常以句法分折的方式进行。结构模式识别主要用于文字识别、遥感图形的识别与纹理图像的分析中。该方法的特点是识别方便，能够反映模式的结构特征，能描述模式的性质，对图像畸变的北京服装学院硕士学位论文抗干扰能力较强。（３）模板匹配法模板匹配法又分为简单模板匹配法、外围轮廓匹配法以及穿线法等，各种模板的提取特征又有所不同。简单模板匹配法不经过粗分类直接用于模板与字符图像的逐点匹配，匹配时采用汉明距离。外围轮廓匹配法采用外围轮廓特征，记录字符边框上各点到达框内字符的最短距离。识别时将待识别字符的特征与预先得到的模板相比较，两者差距由欧氏距离衡量。穿线法也属于字符识别方法中模板匹配的一类，但涉及了字符拓扑结构方面的信息。其基本思想是用一组或几组与水平成一定角度的平行线贯穿字符，提取字符与水平线的交点信息作为识别依据。（４）人工神经元网络方法２０世纪５０年代，研究人员开始模拟动物神经系统的某些功能，建立了神经元模型，并以其为基本单元构建了互联的拓扑网络，即人工神经网络。人工神经网络是由大量简单的基本单元相互连接而成的非线性动态系统，每个神经元的结构和功能都比较简单，但由其组成的系统却可能非常复杂，它具有人脑的某些特性，用于联想、识别和决策。神经网络的主要特点在于其具有信息处理的并行性、自组织和自适应性、具有很强的学习能力和联想功能以及容错性能等，在解决一些复杂的模式识别问题中显示出其独特的优势。因此人们正在深入探讨人工神经元网络用于模式识别的潜力。除了上述介绍的几种方法之外，还有～些新兴的模式分类方法被用于字符识别，比如基于ｚａｄｃｈ提出的模糊集理论１１３】的模糊识别方法，以及基于对传统的统计决策法改进的支持向量机分类器法等。１．３车牌照识别系统及其工作流程按照系统的组成，车牌照识别系统可以分为两个模块，即图像采集模块和车牌照识别模块。车牌照识别系统的一般组成如图ｌ所示。４北京罪装学院硕士掌位论文－……．…＿?－－－－－图ｌ车牌照识别系统的组成上图中箭头标葫了车戆熙系统觞工作流程，其串整缘采集模块包括两个部分。车体感应器和图像采集设备。车体感应器的作用是当待识别车辆驶入摄像头标定区域时及时检测到车辆的进入。触发图像采集模块进行图像采集。图像采集设备包括ｃｃＤ摄像头和图像采集卡。图像采集模块一般是通过雷像采集卡或者透遘直接箭数据总线（奶ｌ￡￡豇３９４，ｕｓＢ２．Ｏ，ｃ删嘲谢ｉｎｋ）直接抓取图像。然后把获得的图像送下～模块，即车牌照识别模块进行处理。车牌照识射模块主要由牌照定位，字符切分和字符识别三个部分组成，在牌照定位之前一般要对牌照图像进行预处理，为了便于操作人员观察可以把图像实时显示出来。牌照定位后，对牌照进行字符切分，然后送字符识别模块，进行字符识别。系统得到的牌照输出信息，可以存入数据库迸行ｌＴｓ的相关处理。１．４车牌照识刘系统率鹩研究难点ＬＰＲ系统研究内容涉及到图像的实时采集、处理和分析，是一个综合的计算机视觉系统。ＬＰＲ系统对实时性、鲁捧性以及抗干扰性均有很赢的要求．由于取样环境复杂多交，例如多数情况下待识别车辆并非静止，而是处于运动状态，这就要求图像采集系统对运动物体有相应的措施；同时受车牌照的整洁程度、光照条件等因素影响，获取的字符样本很可能出现较严重的模糊、顿斜、缺嵌等铸提。这些思索都绘车牌照的字符识别带来７匿难．在我国，除了上述一股性难点之外，由于国内车辆的实际情况，给研发工作造成许多托京鼹装学院硕士学位论文特殊困难，主要有以下几点：（１）我国标准汽车牌照是由汉字、英文字母和阿拉伯数字组成．汉字的识别与字母和数字的识别有很大的不同，从而增加了识别难度；（２）国外许多国家汽车牌照的底色和字符颜色通常只有对比度较强的两种颜色（例如韩国．其车牌照底色为红色，车牌照上的字符为白色），而我国汽车牌照的底色和字体部有多种颜色；（３）其他国家的汽车牌照格式（如汽车牌照的尺寸大小，牌照上字符的排列等）通常只有一种。而我国则根据不同车辆、车型、用途。规定了多种牌照格式（例如分为军车、警车、普通车等）；（４）由于环境、道路或人为因素造成汽车牌照污染严重，这种情况在国外发达国家不允许汽车上踌。而在我国仍允许上路行驶：（５）我国汽车牌照的悬挂位置不统一。这些都给车牌照的识别造成了困难，如何在这样复杂的环境下既达到较快的识别速度。又取得段商的识别率是本系统的研究难点所在，目前国内的车牌照识别技术有持进一步提高，相信随着理论研究的深入，以及计算机科学的发展，车牌照识别技术肯定会逐步走向成熟。１．５本文的主要工作和内容安排本文以车牌照图像为研究对象，主要运用图像处理和模式识剔等学科方面的基本知识，在车辆牌照定位的基础上，致力于车牌照字符分割、字符特征提取以及字符识别算法的研究，在车牌照字符识别部分着重分析７神经网络以及支持向量机在车牌照识别中的应用。在研究谭厢的过程中，本人查阅了有关车牌照识别技术方面的中外文献，’比较了以往车牌照字符识别算法的性能，在此基础上提出了一种基于投影变换和神经网络的字符识别方法。该方法对车牌照字符识别具有良好的效果。针对课题的研究内容，本文的组织结构如下：第一章，酋先介绍了本课题的研究背景和研究意义，然后详细分析了车牌照识别系统的研究现状，给出了系统的框桨结构和工作流程。接着分析了ＬＰＲ的研究难点．比铰了现有的几种字符识别方法，讨论了其优缺点，最后说明了本论文的主要研究内容和框架结构。第二章，首先介绍了车牌照字符分割的相关技术，给出了车辆牌照图像的预处理方法，６北京服装学院硕士学位论文包括灰度拉伸，噪声去除和图像二值化等。在分析了车牌照的先验知识的基础上，结合投影法，完成了车牌照的字符切分。第三章，主要讨论了字符特征的提取方法，说明了特征提取的三个基本要求。分别介绍了字符结构特征提取和统计特征提取两种基本方法，在分析了其优缺点的基础上，结合车牌照字符自身的特点，使用结构特征和统计特征相结合的方法，提取字符特征向量作为后续章节中分类器的输入。第四章，研究了基于神经网络的字符识别方法，首先介绍了神经网络的基本原理，然后分析了ＢＰ神经网络的构造特征，指明了其缺陷和改进措施，在此基础上，结合第三章的字符特征提取方法，提出了一种基于投影变换和神经网络的字符识别方法。第五章，研究了基于支持向量机的模式识别方法。支持向量机是一种新兴的机器学习方法，本章首先介绍了其理论基础，然后分析讨论了组成支持向量机的线性分类器。介绍了支持向量机对非线性可分样本处理的核映射技巧，在此基础上研究了支持向量机在字符识别中的应用，最后建立了基于支持向量机的字符识别系统。第六章，总结了本文工作，指出了存在的不足和改进方向。７北京服装学院硬士学位论文第二章车牌字符分割２．１引言车牌字符识别系统由三个部分组成：字符分割、字符特征提取以及分类器的设计，字符分割是特征提取和实现字符正确识别的基础，因此是该系统的关键组成部分。在字符分割之前，有必要对车牌图像进行预处理。首先介绍本文使用的车牌图像预处理方法，然后结合车牌的先验知识实现字符分割。２．２车牌图像的预处理本文处理的对象是经过定位提取出来的车牌照图像，车辆牌照摄取的过程中可能引入诸多的噪声干扰，首先拍摄现场光照不均可能影响原有的灰度信息，比如遭受阳光直射以及夜晚的光线不足都会淹没原有的灰度信息；再有就是车辆牌照的污损，如果车牌照部分字符缺失，这将给字符识别带来更大的处理难度；字符的粘连也会影响字符的识别。因此在字符分割之前。要对车牌照图像进行预处理。首先将彩色图像转换为灰度图像，然后进行灰度拉伸、图像去噪以及图像的阈值化处理。２．２．１灰度拉伸受夜晚的光照度不够或者白天的阳光直射等因素影响，会引起成像过程的曝光不足，造成图像灰度的动态范围狭窄。这种情况下得到的图像，在进行灰度转换后往往会出现对比度不足的情况，这将直接影响到图像的后续处理结果，因此需要增强图像的对比度。本文选用灰度拉伸的方法增强图像的对比度，所谓灰度拉伸是这样一个过程，有选择地拉伸或压缩某段灰度区间以增强灰度的变化范围、丰富灰度层次，达到增强图像对比度的目的。经过灰度拉伸处理，使得车牌照图像明暗鲜明，这将大大有利于车牌照的字符分盘北京服装学院硕士学位论文割和识别。这种操作可以看成一种基于点运算的图像增强方法，灰度拉伸是对图像进行分段线性变换．该线性变换函数的表达式为：且工．五ｙ＝／（工）＝嚣（一）哪桕≤屯“… ；；；二导（ｘ一屯）＋儿，ｘ＞而２５５一矗、‘（２一１）交换原理可以用图２中的折线表示。２５５咒少ＩＯ五恐２５５原灰度图２灰度拉伸原理图上图中的灰度分布区间ｋ，而】由图像本身特征决定?从图中可以看出灰度拉伸之后，对比度得到了增强。实际情况也是如此，图３给出了处理前后的图像效果对比。彩色图像灰度匿像灰度拉伸后的圈像彩色酉像灰度图像灰度拉伸盾的圈像图３灰度拉伸后的车牌照图像２．２．２图像去噪所谓噪声是指混杂在信源信号中的干扰信号，一般会影响对信源信号的理解。噪声通９北京服装学院硕士学位论文常是随机产生的，一般用概率统计方法来处理。数字图像的噪声主要源于图像的获取和传输过程。图像获取过程中的噪声主要源于图像传感器和环境因素，如图像获取中的传感元器件自身的质量和环境条件等。图像在传输过程中的噪声主要源于所用的传输信道的干扰，比如通过无线网络传输的图像可能会因为光或者其他大气因素的干扰被污染叫。噪声对图像分割效果的影响往往较大。所以在对图像进行分割前进行去噪处理是必要的。滤波可以达到图像去噪的目的，所谓滤波是指从被干扰的信号中将有效信号提取出来的一种方法。形态学操作也能起到分离干扰信号的作用，因此在某种程度上也可称之为滤波。滤波操作的方法可以分为空间域方法和频率域方法。亦可以分为全局处理和局部处理方法，也可以按线性滤波、非线性滤波和自适应滤波来区别。线性滤波具有完善的理论基础，数学处理简单，对高斯噪声有较好的平滑作甩，但对脉冲噪声摔制效果较差并且会使图像的边缘模糊，不能很好地保护图像的细节；而非线性滤波则能抑制非高斯噪声，较好地保护图像的细节和边缘。本文对比研究了以下几种滤波方法： ∞均值滤波局部均值滤波是一种线性平滑滤波，这种滤波器对去除高斯噪声有很好的效果，且在大多数情况下，对其它类型的噪声也有较好的效果㈣。所谓均值滤波，即每一个像素的灰度值，用其局部邻域Ⅳ内各像素灰度的均值ｇ（ｘ，ｙ）来代替，均值计算公式如下：ｇ（ｗ）２玄莓巾?ｙ）理时，常通过滤波模板来实现，常用的滤波模板如表ｌ所示；表ｌ均值滤波模板（２。２）式中肘是邻域Ⅳ内的像素个数，，（ｘ，Ｊ，）是邻域Ⅳ内点（墨Ｊ，）处的灰度值。在进行滤波处ａ（一１，一１）口（一１，ｏ）口（ｏ，ｏ）口（一１，１）口（ｏ，１）口（１，１）位（ｏ，一１）口（１，一１）４（１，ｏ）上圈中为３×３的滤波模板，其中４０，歹）为模板参数?由于均值滤波取的是均值，虽然能够去除图像中的高斯噪声，但滤波后会模糊图像中１０北京服装学院硕士学位论文的尖锐处、边缘处、不连续的点和细节部分，造成图像信息的丢失。因此需要考虑一种既能消除噪声又能保持图像的边缘信息的滤波方法。中值滤波器恰好能满足这种要求。（２）中值滤波中值滤波是空间域法中的一种非线性信号处理方法，已被用来抑制图像中的噪声。在一维的情况下，中值滤波器是一个滑动的窗口，它含有奇数个象元。窗口中心的象元灰度值用窗口中各灰度值的中间数值来代替．中值滤波器可以从一维推广到二维。二维中值滤波的窗口形状和尺寸对滤波效果影响较大。不同的图像内容和不同的应用要求，往往采用不同的窗口形状和尺寸。常用的窗口形状有线状、方形、圆形、十字形以及圆环形等。窗口的尺寸一般先用３ｘ３再取５×５逐渐增大，直到其滤波效果满意为止。就一般经验讲，对于有缓变的较长轮廓线物体的图像，采用方形或圆形窗口为宜，对于包含有尖顶角物体的图像，适宜用十字形窗口。而窗口大小则以不超过图像中最小有效的细线状物体为宜。如果图像中点、线、尖角细节较多，不宜采用中值滤波。车牌照图像滤波的目的是要最大限度地消除噪声。突出车牌且标。故采用方形滤波器。在图像中以当前像素位置（ｘ，ｙ）为中心切出一个ｍ×作（例如３×３）的像素邻域，滤波后的灰度值为埘×一个像素灰度值序列的中间值。表２给出了３×３的中值滤波器模板。表２中值滤波模板厂Ｏ―ｌ，ｙ―１）／（ｔｙ―１），Ｏ＋ｌ，ｙ一１）（３）维纳滤波／Ｏ―ｌ，Ｊ，）／（ｘ，ｙ）厂Ｏ＋ｌ，Ｊ，）厂（ｘ～ｌ，ｙ＋１）／（工，Ｊ，＋１），（工十１，ｙ＋１）维纳滤波又称最小均方差（ＬｃａｓｔＭｃ觚ｓｑｕａｒｅ，简称ＬＭｓ）滤波。在这种滤波器设计方法中，将信号和噪声都视为随机信号，在对这些随机信号进行统计分析的基础上设计出符合均方差最小准则的滤波器。维纳滤波器的原理可用式（２．３）表示：如Ｅ｛（，＿夕）２｝㈣式中Ｅ｛哼是误差的期望值，Ｊｒ是原图像，夕是对它的估计。该式通过求解Ｐ２的最小值，使它们之间的均方误差最小，以此达到噪声滤除的目的。这里噪声类型为加性噪声，估计的北京服装学院硕士学位论文灰度值是退化图像灰度值的线性函数。在上述条件下，式（２．３）中误差函数的最小值，在频域用下列表达式计算：其中，户（“，ｖ）是对原图像的估计，该值即为滤波器的输出结果，Ｇ（“，ｖ）是退化图像的变换，日（”，ｖ１是退化函数的变换，即∽＝［南雨黥卜Ｖ，㈤１日（“，ｖ）１２＝日‘（Ⅳ，ｖ）Ⅳ（“，ｖ），其中Ⅳ．（“，ｖ）是复数量日（“，ｖ）的共轭，最（“，Ｖ）是图像中干扰噪声的功率谱，舅（甜，Ｖ）是未退化图像的功率谱，这就是众所周知的维纳滤波。当处理白噪声时，噪声功率谱％（“，Ｖ）为一常数，这就大大简化了处理过程。但是未退化图像的功率谱墨（“，Ｖ）很少是已知的。当这些值未知或不能估计时，经常使用的方法是下面的近似表达式：即∽＝‰嵩特卜Ｖ，这里Ｋ是一个常数。前后的效果对比图。㈣，比较上述三种滤波器，均值滤波在平滑图像的同时也淹没了细节，后两者均能保留细节，但是维纳滤波在计算量上要大于中值滤波，在滤波效果差别不大的情况下，考虑到ＬＰＲ系统的实时性要求，本文选择中值滤波作为车牌照的灰度图像去噪算法，图４为中值滤波直接阈值化的二值匝德跨浚后闻僵化的：值图像图４中值滤波效果图１２北京服装学院硕士学位论文２．２．３图像二值化二值化方法是图像分割的一个重要方法，它的目的是将图像中有意义的特征或者需要应用的特征提取出来。这些特征可以是图像场的原始特征，如物体占有区的像素灰度值、物体轮廓线和纹理特征等，也可以是空间频谱或直方图特征。二值化处理就是利用图像中要提取的目标物体与背景之间灰度上的差异计算出一个阈值（豫Ｍ幽。髓），用以把原始图像分为前景和背景两部分。设图像，（ｘ，），），其灰度级范围为【ｚｌ，Ｚ２】，在Ｚｌ和Ｚ２之间选择一个合适的灰度阈值ｒ，则二值化后的图像ｇ（ｘ，ｙ）可以表示为：咖∽＝忙舅跺；或者㈤㈣删＝忙巍籍经过二值化处理后，车牌照图像就被分为黑白两部分，选择不同的阈值就会得到不同的分割结果。常用的阈值选取方法主要有整体阈值法、局部阈值法和动态阙值法三种。经过理论分析与实验，本文的车牌照图像的二值化处理选用锄“算法（又称大津法），伪纽算法属于动态阈值法【ｌ‘１。动态阙值化算法从整个灰度图像的像素分布出发，寻求一个最佳的阈值，它是在最小二乘法的基础上推导出来的。在这种方法中，设一幅图像的灰度值范围为【ｚｌ，Ｚ２】，以阈值ｒ把图像分成目标像素（暗）ｃ０和背景像素（亮）ｃｌ两类，其中ｃｏ包含的灰度级为（ｚｌ，ｚｌ＋ｌ，．．．，ｒ），ｃｌ包含的灰度级为∽＋１，ｒ＋２，．．．，ｚ２）。定义啊是灰度值为ｆ的像素点个数，则主要的统计量及其运算公式为：图像的总像素数：＾ｒ＝∑珥灰度值ｆ的概率：（２－７）Ｐ（栌景（２－８ａ）北京服装学院硕士学位论文目标的概率：纯＝∑ＪＰ（１）ｊ－五（２―８ｂ）背景的概率：ｚ＇毯＝艺．Ｐ（ｊ）目标像素的灰度平均值：（２―８０盹：争强盟胪萎－等ｌ＝ｚｌ“，ｏ（２．９ａ）背景像素的灰度平均值：鸬＝姜。一掣图像的灰度平均值：缛＝％鳓＋熟段目标像素的方差：（２―９ｂ）（２―９ｃ）％＝妻譬攀皿‘ｌ（２－１０ａ）一０背景像素的方差：铲，条。―焉＿ｊ－ｒ＋１―．÷（卜“）２Ｐ（ｆ）ｗＩ（２．１０ｂ）由上述基本统计量，得到如下三种方差作为求取阈值的主要依据，即：图像的总体方差：听＝釜。一所）２ＪＰ（ｆ）类间方差：（２?１ｌａ）％＝嘞（胁一所）２＋ｑ∽一所）２类内方差：（２－１ｌ”％＝‰％＋ｑ吒（２－１１ｃ）根据类内方差露、类间方差蠢和总体方差刃的相互关系，引入如下三个等效的度量１４北京服装学院硕士学位论文参数：２：乓听（２．１砩（２．１２ｂ）茁：乓％，７：善听（２．１２ｃ）当取某一图像的阈值ｒ使得当前准则中变量五或ｒ或玎取得最大值时，得到的ｒ即为最佳阈值。鉴于计算量的考虑，人们一般通过优化第三个准则获取阈值。本文采用其简化的计算公式：仃（？）＝％（岛一所）２＋ｑ（一一所）２（２－１３）其中，盯（丁）为两类间最大方差。即阈值ｒ将图像分为目标和背景两类，当两类总方差盯ｐ）取最大值时，ｒ即为最佳阙值。这种二值化算法不论图像的直方图有无明显的双峰，都能得到较为满意的效果。因此这种方法是阅值自动选取的较好的方法，阂值化操作的效果如图５所示。彩色啊像衰度圈像二值图像影色曩像灰度匣银二擅曩像图５阚值化效果圉２．３字符分割车牌字符分割是车牌识别中的重要一步，字符分割就是把多字符图像中的每个字符从整个图像中切割出来成为单个字符。本文的研究中，采用车牌照二值图像投影特征，结合车牌字符的先验知识进行分割。１５北京服装学院硕士学位论文２．３．１车牌的先验知识本文用到的车牌特征主要是车牌照的尺寸和字符的尺寸，以及二者的比例关系，目前我国汽车使用较多的是９２式车牌，图６所示即为这种车牌的尺寸特征。船Ｔｌｌｌ图６９２式车牌针对这种车牌照，其字符分布有如下先验知识可以利用：（１）标准的民用车辆牌照（军车、警车、教练车、领事馆车除外）上均有七个字符，首位为省名缩写（汉字），次位为英文字母，再次位为英文字母或阿拉伯数字，末四位字符均为阿拉伯数字。（２）车牌照字符分布在车牌照的中心区域，均为规则的印刷体字，字符的高度、字符的宽度、间隔符、字符间距以及车牌的长度等都有严格的规定。（３）车辆牌照上７个字符和一个间隔符横向水平排列，字符高度为９０Ｉｌ眦，宽度为４５ｍｍ，间隔符宽度为１０ｍｍ，字符和字符之间或字符和间隔符之间的距离为１２ｍｍ。实际上，每个字符是居中分布在一个高为９０ｌｎｍ、宽为４５蚴的矩形范围内，但具体字符并不一定充满这个矩形区域。（４）使馆车牌照的间隔符在第四和第五个字符之间，其余的车牌的间隔符在第２个和第３个字符之间。由于使馆车牌照出现概率很小，将之视为小型车牌照的一种变形情况，不单独处理。北京服装学院硕士学位论文２．３．２字符分割算法２．３．２．１车牌照上下边界的确定为了便于处理，首先把车牌照图像统一转化为字符为前景（亮点），底色为背景（暗点）的图像。通过先验知识得知，字符分布在车牌照的中心区域，与上下边框之间都存在着一定的空隙。因此，对车牌照图像进行水平方向的投影操作，必然会得至Ⅱ存在两个较大梯度变化值的投影图，如图７所示，这两个较大的梯度变化所对应的就是字符与边框存在的空隙，据此，我们就能确定字符的上下边界。原始皤假衰度翻转膳竹蕾馕水平投影图７车牌的水平投影最后除去上下边框后的图像为原圈像上下边框去掉盾的啊慑图８除去上下边框后的车牌图像２．３．２．２车牌照左右边界的确定从上图可以看到，车牌照的上下边界基本确定，这时需要确定的就是车牌照的左右边界了。首先从左向右扫描车牌照图像的垂直投影图，找到第一个大于阙值ｒ（本文取垂直投影最大值的ｌ／５）的投影，跟踪投影直到小于ｒ的波谷，当出现陡变为波峰的位置即为车牌照的左边界（记为础一Ｚ妒，即第一个字符的左边界）。通过前面对车牌照上下边界的确定，我们可以得到车牌照的高度（记为ｐ缸耙一艇ｔ咖ｆ。也即单个字符的高度），根据车牌的先验１７北京殿装学院硕士学位论文知识，可以估算出车牌照的宽度（记为ｐ抽耙一ｗ幼＾），约为４．４３。ｐ缸据一＾Ｐ￡咖，。考虑到误差的存在，在衄钯一￡够＋加纪一ｗ础是周围【－ｓ，５】像素范围内寻找波谷位置，即为车牌照的右边界（记为ｐ肠把一，堙断，也即最后一个字符的右边界）? 车牌照的垂直投影特征如图９所示，图１０显示的是去除边框后的图像。阏僮化圈馕竖直摄影匡画ｌＪＩｌ－．ｊＩＩ－－－ｌＩｊ图９车牌照字符的垂直投影特征边椎去豫蜃的的叠慑边括去陡后的酉像的垂直挠影图ｌＯ除去边框后的图像２．３．２．３字符分割算法的实现根据上面的直观描述，采用投影法，并借助车牌照字符固定宽度、问距的固定比例关系等先验知识，设计程序实现字符的分割。该程序的流程如下：（１）分析车牌图像在水平方向的投影，结合车牌照的先验知识。确定其上下边界：ｐｌａ把一ｌ节和ｐｌ硪ｅ―ｄ０Ｗｎ。（２）分析车牌图像的垂直投影，根据先验知识，首先确定车牌照的左端边界ｐ触一幻｝，然后根据计算得到的ｐ触一ｗ础矗，最后搜寻车牌照右端边界ｐ船一，增胁。（３）根据实际字符高度和先验比例关系，计算单一字符宽度。甜一ｗ蝴，字符间距劭∥一＃即卯以及第二字符和第三字符间距ｃ栅一印叩口２３，考虑光照不均匀和阅值化误差的因素，实际的二值化车牌照图像中，字符宽度和间距与上述计算值有ｌ口２个像素点的浮动。其中；Ｃ栅一ｗ埘场＝，妇一厅ｅ‘ｇ＾ｆ×４５／９０（２－１４）ｌｇ北京服装学院硕士学位论文Ｃｈ甜一ｓｐａｃｅ＝ｐｌｄｔｅ―ｈｅｉｇｈｌｘｌ２ｆ９０（２?１５）啦。ｌ∞ａ榭一印卯Ｐ２３＝ｐ２ｄ把一抛ｉ驴ｆｘ３４，９０（４）对去除上下边框后的字符图像作垂直投影。由于最稳定的是第二字符和第三字符间距硼盯一掣２３，因此首先从投影图上检测这一间距，得到第二字符右边界锄钟一ｒｉ咖，【２】和第三字符的左边晃∞钟一ｚ咿【３】，根据∞胛一ｗ础矗并以硼盯一，留珩［２】为起点向左检测第二字符的左边界Ｇ妇一幻？【２】，并以ａ衙一幻｝【２】为新的起点检测第一字符的右边界，同理，以∞甜一坦声【３】为起点向右检测第三到第七个字符。（５）根据检测出来的七个字符的左右边界∞甜一幻｝【ｆ】（其中ｆ∈【１，７】）和ｃＡｎｒ―ｒ瑶咖【司分割出单一字符，算法结束。图ｌｌ－ａ给出了车牌照中单个字符的垂直投影特征，图１１．ｂ为根据投影特征分割出来的单个字符。经过上述方法处理，基本上可以将字符分割出来。＿▲０▲Ｕ－－图１１．ａ字符的垂直投影团圜固囝囝囝固图１１．ｂ分割出的单个字符２．４小结车辆牌照的识别包括字符分割、特征提取和分类器设计三个部分，做为其中一个关键步骤，字符分割对后续的特征提取和最终的字符识别起着重要的作用。本章首先对车牌照图像进行预处理，包括图像灰度拉伸，图像的滤波以及阈值化等。在此基础上根据车牌照图像特征和车牌照先验知识相结合的方法，设计算法，实现了车牌照字符分割，为后续操作打下了基础。１９北京服装学院硕士学位论文第三章字符的特征提取３．１引言本章介绍字符识别中的特征提取部分，特征提取是字符识别系统中的关键一步。本章的处理对象是经过第二章的字符分割得到的单个字符图像，在进行字符特征提取之前仍要进行必要的预处理，其中包括去除噪声的形态学滤波以及字符的归一化操作。介绍了两种字符特征提取方法，在分析了两种字符特征提取方法的优劣的基础上，将字符结构特征和统计特征相结合。作为后续操作用到的字符特征向量。３．２字符特征提取前的预处理３．２．１形态学滤波阊值化后的字符图像还可能会存在一些噪声干扰，比如一些孤立韵点，这恰好可以通过形态学【３ｌ操作进行滤除。首先介绍膨胀（ｄｉｌａ＿哟和腐蚀（ｅｒｏｓｉｏｎ）的定义，然后使用开运算处理图像，达到滤除噪声的目的。３．２．１．１膨胀下面先进行直观描述，然后给出数学公式。对于两幅图像：初始凰像厶和结构元素厶，令Ａ和Ｂ为有序对集合，分别由无和厶中各自的前景像素坐标组成。定义４，表示集合Ａ关于集合Ｂ中元素６的平移操作。图１２给出了膨胀操作的一个实例，用符号以。ｔｌｌ表示集合Ａ对于Ｂ中元素（ｏ，１）的操作，这种操作是把Ａ向上平移一个单位：符号Ａ０，ｏ）表示零操作，即集合Ａ保持不动，不进行任何平移操作。将两个操作的结果求并集，其最终结果即为初始图像无关于结构元素厶膨北京服装学院硕士学位论文胀，记做无。厶，得到的结果如图１２－ｃ所示。■■图１２－ａ初始图像厶图１２－ｂ结构元素磊图１２。ｃＡｏ＇ｏ）图１２－ｄ＾。Ｊ）图１２＿ｃ膨胀操作的结果关于膨胀的数学说明，定义Ａ关于Ｂ的膨胀运算为：彳。口＝｛口＋６Ｉ口∈彳，６∈曰｝则在形式上，该式等同于对Ａ的所有平移结果取并集（３一１）４０丑＝Ｕ４３．２．１．２腐蚀（３―２）定义腐蚀为膨胀的逆运算，用下式表示：枷＝ｍｋ嚣（３－３）式中雪是指集合曰的反对称集。该式的含义是，图像正关于图像五的膨胀，相当于图像无的前景像素集Ａ对图像石的前景像素集Ｂ的反对称集中每一个元素分别作平移操作，最后对这些平移操作的结果取交集。图１３给出了腐蚀操作的过程，图１３－ｆ所示即为２ｌ北京服装学院硕士学位论文得到的最终结果。｝ｌ，‘，●，±ｌＯ目图１３－ｂ结构元素厶图１３?ｃ五的反对称集，８７６，●，：，Ｏ屠描隅Ａ叩）图１３．ｅ以¨，ｏ）图１３?ｆ腐蚀操作的结果图１３－ｄ３．２．１．３开运算和闭运算将膨胀积腐蚀操作相结合。根据先后次序的不同，可得开运算衣闭运算，两者分别定义如下：无关于一个结构元素厶的开运算细嫩ｌｉｌｌｇ）可表示为：兀Ｑ磊＝（无ｅ如）ｏ厶无关于一个结构元素兀的闭运算（ｃｌｏｓｉｎｇ）可表示为：（３．４ａ）厶％＝（厶毋兀）％（３删开运算和闭运算均能起到消除孤立噪声点的作用，主要原因在于其中包含了腐蚀操作。在图１４中可以看到，形态学操作对于二值图像的去噪具有很好的效果，因此本文选择使用形态学开运算滤除车牌照字符的噪声。ｊｔ哀服装学院硕士学位论文灰度重像二值啊像形奋擘滤涟盾的二值瞳像图１４形态学滤波３．２．２字符尺寸的归一化对不同大小的字符做变换，使之成为同一尺寸大小的字符，这个过程被称作大小归一化。在归一化过程中，如何选取合适的大小，使得变化后的图像既保持了原有图像的特征又能够减少计算量是一个非常关键的问题。实验结果表明，ｌＯ×１８像素的字符点阵就能保持输入字符的形状和基本特征【…，而且减少了计算量，加快了识别速度。如果继续减小字符点阵，则会使汉字变得模糊，影响识别的准确率。如果仅仅识别英文字符和阿拉伯数字，则可以将归一化尺寸减小到４×５像素１１８】。由于本文设计的识别器是针对车牌中的所有字符，放选用１０×１８像素作为归一化尺寸。字符尺寸的归一化分两步进行，首先是坐标变换，然后是灰度级赋值。坐标变换原理如下：嘲＝［台删∞，式中（％＋”，％＋Ｖ）为原图像中像素点的坐标，“，Ｍ）为目标图像中像素点的坐标，取（而，％）为某整数值，砧，Ｖ为【ｏ，１）半开半闭区间内的实数。把原图像中点的坐标分解为整数和小数和的形式表示，是为了便于插值操作的原理分析。式中Ｚ和工的计算方法如下：…”… ｐ６曲正＝ｄ隔＝号警 ‘＝ｄ勰＝号警“归一化后的图像宽度ｌＯ即归一化后的图像高度１８㈣…～７北京服装学院硕士学位论文上述坐标变换中，根据目标图像中像素点的坐标“，Ｍ）变换得到原图像对应像素点的坐标（‰＋“，蚝＋ｖ），然后进行灰度赋值。由于（黾＋甜，％＋Ｖ）不一定是精确的整数值，所以有必要应用插值算法取近似值，根据取值的方法不同，可分为最近邻插值法和双线性内插法两种算法Ｍ。３．２．２．１最近邻插值法最近邻插值法又称近邻取样法，图１５给出了这种操作的原理。ＨＨＵ＝：ｌＨＪ，ｔ５ｙＪ，／空间变换（而，ｙＩ），，７――＼＝Ｊ奠Ｊ５Ｖ，，，＼、／＼＼、＼灰度级赋值＼●．砩＋“，ｙｏ＋／／／＼ｋ％）图１５最邻近插值法在最邻近插值算法中，首先将目的空间中像素点坐标（‘，乃）通过反向变换得到的原空间中像素点坐标（而＋甜，儿＋Ｖ），对其进行简单取整，然后将取整后的坐标对应的灰度值赋给点（葺，期）即可，即，“，Ｍ）＝ｇ（，Ｄ堋ｄ（而＋“），，Ｄ删（％＋Ｖ））。可见，最邻近插值简单直观，计算量也不大，但得到韵图像质量不高。如果用这个方法进行图像放大，那么在比例较大的情况下就出现图像扭曲的现象。可以用更完善的技术得到较平滑的结果，例如，立方卷积内插等，但使用这种技术将会带来很大的计算开销。３．２．２．２双线性内插法鉴于最邻近算法的缺点．本文采用双线性内插法进行图像插值。该算法虽然复杂度稍高，但得到的图像质量较好。在双线性内插法中用４个最近邻点，通过下列计算得到目的空间中像素的灰度值。对于一个目的像素“，乃），首先依其坐标通过变换得到原空间中像素点坐标（而＋”，％＋ｖ），则该点像素的灰度值由其４个最近像素点的灰度值确定，即点（％，％）、（而＋１，％）、（而，％＋１）和（％＋ｌ，％＋１）的灰度值，计算式如下：２４北京服装学院硕士学位论文“”虬胪…三。Ｓ紧糯２黜ｉ％胪Ｄ＋“（１一Ｖ）ｇ（确＋ｌ，％）＋ｚｎ苫（而＋１，％＋１）厂（五，咒）＝ｇ（而＋＂，％＋Ｖ）值。双线性内插法的原理鲡图１６所示。目的！！阃，ｂｙ１ｐ乃、 ’（３―８）其中ｇ（‰，儿）为原图像中点（‰，儿）处的灰度值，，“，Ｍ）为目的图像中点（而，月）处的灰度“，咒）／／≮磊、图１６双线性内插原ｇ！间ｇ（五ｙ．／‰，Ｊａ）＼／Ｉ（而＋“，，乍＋ｖ）＼／＼奎壁墨壁竺／／双线性插值虽然比普通的最邻近插值计算量要大，但是缩放后图像的质量较高，因此本文的归一化过程采用了该方法。归一化后的字符图像可以送入字符识别模块进行识别操作。３。３常用字符特征提取方法用于字符识别的分类特征应满足以下要求：（１）有较强的分类能力，类内各样本距离应尽量小，类间距离应尽量大。（２）具有较高的稳定性和鲁捧性，尽量减少笔划断裂或粘连的影响。＜３）易于提取，在保证系统性能稳定的前提下，特征的维数不宜过高，以减少运算量和存储复杂度。但是一般情况下，上述三点很难同时满足。在字符识别中，字符特征可分为两种．即结构特征和统计特征，它们各有优缺点。３．３．１字符结构特征在光学字符识别（Ｏ―ｃａｌｃｌｌａｒ∞ｔｅｒＲ∞ｏ弘ｉｔｉｏｎ，简称ＯｃＲ）技术发展初期，结构方法北京服装学院硕士学位论文得到了广泛的研究，其基本思想是把字符图像分割为若干基元，如笔画、拓扑点、结构突变点等，与模板比较，根据基元的有无判断所属的类别。结构特征提取方法的重点在于怎么样得到以基元表示的结构信息。目前常用的结构特征提取方法主要有基于骨架特征的方法，基于轮廓特征的方法和基于笔画特征的方法等【”。“。３．３．１．１基于骨架特征的方法基于骨架的方法是结构特征提取的主流方法。字符的骨架是经过细化得到的，细化有迭代剥离和直接获取两种方法。迭代剥离是通过搜索图像边缘，反复考察边缘点的连通度并结合相应的规则来决定点的去留。直接获取法根据每条扫描线的黑游程中点得到中轴。基于骨架的结构特征包括特征点、端点、交叉点、转折点等。骨架特征的提取极大地依赖于图像细化质量。由于现有的细化算法都或多或少的出现一些拓扑结构的改变，如Ｙ形分叉、毛刺、断线等。这就要求后续识别分类器有较大的规则灵活性。目前以骨架特征为主要描述特征识别系统已很少，往往只用于小类集内的区分或附加判别的依据。３．３．１．２基于轮廓特征的方法轮廓也可以反映字符图像的结构。轮廓提取方法简单，结果确定。因而它不失为一种好的结构信息。轮廓大致有两种描述方法：其一，类似骨架用结构点和弧构成图的方法来描述，识别也与骨架相同；其二，用标准化后的轮廓的最远、最近点和最大、最小突变点得到一系列结构特征，构成识别规律。轮廓相对于骨架。带入了更精确的位置信息，也节省了细化的运算量，但它易受到笔画宽度和断线的影响。需要注意的是，预先设定的规则中有很多涉及位置参数，恰好车辆牌照中字符的结构和轮廓相对固定，因此在车牌照字符中，用轮廓特征对其特点有较强的描述能力。本文中选取轮廓特征作为字符特征的辅助描述特征。３．３．１．３基于笔画特征的方法字符的笔画特征也具有较强的抽象能力，在这方面也有不少的科研论文发表，贾婧等在其文章㈨中提出了基于字符的横、竖、撇、捺和弧线等结构基元的笔画特征提取方法，该方法具有较快的运算速度，但是在字符分辨率不高的情况下，对存在弧线结构的字符有可能会造成误分；宋加涛等提出了一种基于字符细节点特征和拐点的特征提取方法㈨，这２６北京服装学院硕士学位论文种方法虽然具有较好的描述能力，但是涉及到字符的细化和骨架提取，计算量相对较大。３．３．２字符统计特征统计特征是从原始数据中提取与分类最相关的信息，这种方法的指导思想是使类内差距极小化，类间差距极大化，因此从出发点上就契合了对特征提取的基本要求，是一种很好的特征度量方式。统计特征应对同一类字符的形变尽量保持不变，另外统计特征可以分为全局特征和局部特征。３．３．２．＇全局统计特征全局特征是对整个字符图像进行变换，提取的可以是字符的欧拉数（ＥｕｌｅｒＮｕｍｂ哪特征、外围轮廓特征和矩特征等，进行的变换诸如ＫＬ变换，Ｆｏｌ｜ｒｉｅｒ变换、小波（ｗ打ｅｌｃｔ）变换等。几种常用的全局特征提取方法为如下几种：欧拉数特征：是针对字母和数字的网孔所采取的一种粗分类的方法，它可使字符快速地分为网孔数为０，ｌ，２的三类，可作为提取特征值的一部分。矩特征：该类特征具有线性映射不变性，与人的视觉特点相符。实验表明当选取１０．１５个特征构成特征向量时，才能有效分类。ＫＬ变换：又名主元分析法（ＰｒｉｎｃｉｐａｌｃｏｍｐｏｎｅｍＡｎａｌｙＳｉｓ，简称ＰｃＡ），通过变换将信息集中于最小维数的特征向量。当变换后截取的维数一定时，ＫＬ是变换前后方差最小的变换。离散Ｆｏ谢盯变换（ＤＦＤ：是一种常用的数学变换，已经开发出快速变换方法（拶ｒＦｌ），且变换性质有清晰的理论描述，已得到广泛应用。小波变换：是一种新兴的信号信息分析方法，是图像分析和图像压缩的重要分析工具，小波变换的多尺度分解特性更加符合人类的视觉机制，与计算机视觉中的由粗到细的认识过程十分相似，更加适于图像的信息处理。因此一些研究者将该方法用于字符的特征提取，并且取得了较理想的效果。３．３．２．２局部统计特征局部特征是在特定的位置对特定大小的窗内图像进行变换，主要包括局部灰度特征、投影特征、方向线素特征等。对这些特征分析如下：北京服装学院硕士学位论文局部灰度特征：又称粗网格特征，它通过将标准化图像划分成固定或弹性的网格并求出每个网格中的平均灰度或目标像素点的个数，就可以得到维数为网格数目的特征向量。投影特征：通过对标准化的图像求水平方向和垂直方向的投影得到Ｍ维和Ⅳ维特征向量（肘和Ⅳ由图像自身的尺寸决定），投影特征计算简单，用于粗分类时有较好的分辨性。因其具有很低的计算复杂度，所以在实时性上表现出众，本文用来作为车牌照字符的主描述特征。方向线索特征：它首先将轮廓划分为一定的网格，在各个网格中将每个点的不同方向的相邻目标像素点分为若干类。方向线素在一个局部邻域内各个方向的多寡反映了笔画在该邻域内的走向。由于网格位置包括了笔画的分布信息，因此，方向线素能比较全面地代表图像信息，具有较好的特征描述能力。３．４轮廓结构和统计特征相结合的特征提取由于字符的识别问题是类别数日较大的分类问题，所以在构造一个高性能的识别系统的过程中，如何选择有效的描述特征显得非常重要。任何一个特征都是从某一个角度刻画图像的，在对识别对象的本质不能完全掌握的情况下。很难轻易取得高识别率。我们只能根据图像类别和环境特征决定特征提取的方法。针对车辆牌照字符识别的实际情况，本文选择了轮廓特征和统计特征相结合的方法完成特征提取。轮廓特征选取二值图像中每行（每列）第一个白点和最后一个白点的距离，统计特征选用投影法提取每行（每列）的投影特征。３．４．１轮廓特征提取轮廓可以反映字符图像的结构，轮廓提取方法简单，结果确定，因而它是一种很好的结构信息。经实验验证，该特征对车牌照字符的特点有较强的描述能力。结合图１７说明提取过程如下，下面均以该图为例说明。北京服装学院硕士学位论文图１７－ａ字符“Ｆ”的二值图像图１７．ｂ字符“Ｆ”对应的矩阵在图１７中，首先计算得每行的第一个灰度值为ｌ的点和最后一个灰度值为ｌ的点间的距离，然后计算每一列第一个灰度值为ｌ的点和最后一个灰度值为１的点间的距离。由此可以得到两个描述轮廓特征的量，这里规定如果该行（列）没有ｌ值则距离为Ｏ，如果该行（列）有１个１值则距离为ｌ。则在图例中，行和列的特征向量分别为：‰＝（０，６，８，７，３，３，４，７，８，７，３，２，２，２，２，２，Ｏ，０）；瓦严（Ｏ，１４，１５，ｌＯ，９，９，９，９，７，Ｏ）。３．４．２投影特征提取投影变换提取字符在不同方向上的像素特征，由于该方法提取的是字符的全局统计特征，因此对字符的局部笔画特征以及噪声干扰并不敏感，而且算法复杂度不高，故本文选择投影特征作为字符的主描述特征。如第３．４．１节所述，本文处理的字符图像是灰度值为ｌ和Ｏ的二值图像，＠，力，设其大小为肘×Ⅳ。对其进行如下操作，则可得行投影向量‰和列投影向量圪，：ⅣＰ脯＝∑／以力村（３．９ａ）岛＝∑，（ｘ，力，Ｉｌ（３．９ｂ）其中ｘ＝ｌ，２，．．．，肘，Ｊ，＝ｌ，２，．．．，Ⅳ．经过上述操作，得到的图１７．ａ所示字符的两个投影向量分别为：Ｃ。；（０，６，８，６，３，３，４，７，８，７，３，２，２，２，２，２，Ｏ，ｏ）；２９北京服装学院硕士学位论文，■＝（Ｏ，１４，１５，ｌＯ，７，５?６，６，２，Ｏ）ａ３．４．３字符特征的综合把通过３．４．１节和３．４，２节介绍方法得到的字符特征综合起来，作为该字符的特征描述。为了后续处理的方便，一律表达为向量形式，即特征向量。则图例中字符“Ｆ”的综合特征向量为：矿＝（‰ｒ如，‰，匕）＝（０，６，８，７，３，３，４，７，８，７，３，２，２，２，２，２，０，０，Ｏ，１４，１５，ｌＯ，９，９，９，９。７，Ｏ，Ｏ，６。８，６，３，３。４，７，８，７。３，２，２，２。２，２，Ｏ，０，Ｏ，１４，１５，１０，７，５，６，６，２，Ｏ）３．５小结本章首先讨论了图像特征提取前的预处理操作，然后针对车辆牌照字符的特点，提取字符轮廓特征和统计特征向量，作为分类器的输入特征。在后续章节的字符识别中，显示出了这种字符特征提取方法的有效性。托京罪装学院硕士擎位论文第四章基于神经网络的字符识别４．１引言本章研究了车牌照字符识别的分类器设计方法，主要介绍了基于ＢＰ神经网络分类器的字符识别方法。经过第二章介绍的图像预处理等步骤，以及第三章介绍的特征提取，把得到的特征量送入分类器进行识别。本章首先介绍了人工神经网络的产生以及基本原理，指出了通用神经网络存在的缺陷，并对其进行改进，提出了一种基于投影变换和ＢＰ网络的字符识别新方法，建立了基于神经网络的字符分类器，实现了车牌照字符的识别。４．２神经网络的基本原理４．２．１生物神经元入类具有高度发运的大蕊。大秸是思维活动钓物质基础，而器维是入类智能的集中俸现。长期以来，脑科学家想方设法了解和揭示人脑的工作机理和思维的本质。研究表明人脑约由１０１Ｌ１０１２个神经元组成，其中，每个神经元约与１０４￣１０５个神经元通过突触连接，形成极为锗级复杂而且又灵活多交的神经网络。图１８是两个生物神经元的连接情况。可以看出神经元主要由三部分组成：树突、细胞体和轴突。树突是树状的神经纤维接收网络，它将电信号传送到细胞体；细胞体对这些输入信号进行整合并进行阈值处理；轴突是单根长纤维，它把细胞体的输出信号导向其他神经元。～个神经细胞的轴突和另一个神经细胞树突的结合点称为突触。神经元的排列和突触的强度（由复杂的化学过程决定）决定了神经网络的功能。图１８生物神经元模型大脑具有通过其自组织（Ｓｅｌｆ：Ｏ玛蛆豳ｉｏｎ）、自学习（Ｓｅｌｆ－Ｌｅａｎ如曲，不断适应外界环境的变化的能力。所谓学习就是在神经元之间建立新的连接或对已有的连接进行修改，并把这些变化存贮在神经元及其之间的连接上的过程。大脑的自组织、自学习性，来源于神经网络结构的这种可塑性（Ｐ１枷ｃｉｔｙ），它主要反映在神经元之间联接强度是可变的。４．２．２人工神经元模型目前人们提出的神经元模型已有很多，其中提出最早也是影响最大的，是１９４３年美国心理学家ｗｉｎ姐Ｍｃｃｕｌｌｏｃｈ和数学家ｗａｌｔｅｒＰｉｔｃｓ提出的Ｍ．Ｐ人工神经元模型【２５ｌ。该模型经过不断的改进后，形成目前广泛应用的神经元模型。其结构可以用图１９表示。图１９人工神经元模型图中，而表示这个神经元的输入，即其他神经元和这个神经元联系；％是这种联系的强度；∑表示神经元对输入信号的处理，通常是加权处理；北京服装学硫硕士学位论文，（曲是神经元的激活函数；ｙ，就是该神经元的输出。其中ｆ＝１，２，．．．，刀，以是和该神经元建立的连接总数；．，＝ｌ，２，．．．，册，肌是该层神经网络中神经元的总数。这是一个多输入／单输出的非线性信息处理单元。该模型的主要特点是把神经元输入信号的加权和其阈值相比较，以确定神经元的输出。如果加权和小于阈值，则神经元输出为零；如果加权和大于阈值．则神经元输出为ｌ。神经元，的输出ｙ。可以表示为：乃＝礁巧旬＼ｆ＝１／㈩，，（砖是神经元钓激活函数＜Ａｃ垃ｖ撕ｐ玎Ｆｎｎ西饼１），也称交换函数。不同裨经元的数学模型的主要区别之一在于采用了不同的变换函数，从而使神经元具有不同的信息处理特性。４．２．３人工稗经两络神经细胞是构成神经系统和大脑的基本单元，神经网络就是通过对人脑的基本单元的建模和连接，来模拟人脑的掉经系统功能特性，其｛壬务就是构造具有学习、联想、记忆和模式识别等智能信息处理功能的人工系统。简单的说一个神经网络是一个由简单的处理单元构成的大规模的并行分布式处理器【拍１。研究表明决定神经网络模型整体性能的有三大要素，这些因素分别为：（１）神经元（信息处理单元）的特性；（２）神经元之间相互联接的形式――拓扑结构；（３）为适应环境而改善性能的学习规则。下面就分别从这三个方面介绍人工神经网络的构成。４．２。３，’神经元鹤特憧神经元的信息处理特性是决定人工神经网络整体性能的三大要素之一，因此变换函数的砑究具有重要的意义。常用的有以下四种变换函数。（１）阈值型变换函数北京服装学院硕士学位论文阈值型变换函数采用了阶跃函数，由下式定义：胁｛：＝：：＝典的Ｍ．Ｐ模型就是属于这一类。（２）分段线性变换函数线性变换函数的输出等于输入，即Ｊ，；／（Ｊ）＝ｘ㈤具有这种作用方式的神经元称为阈值型神经元，这是神经元模型中最简单的一种，经（４―３）单极性分段线性变换函数ｆＯ并＜０ｏｓ上≤ｃ），＝八工）＝｛ｘ（４川【ｌ双极性分段线性变换函数ｆ―Ｉｘ＞ｌ工＜一１ｙ＝厂（曲＝｛ａｌｓｘ≤‘ｘ＞ｌ（４－５）【ｌ线性变换函数如图２０所示：，（ｘ）ｌ０∥Ｘｃ厂（ｘ）ｌ工一一ｌ图２０－ｂ双极性分段线性函数／“∥ｘｃｘ图２０－ａ单极性分段线性函数（３）非线性变换函数非线性变换函数中常用的是ｓｉ卸∞ｉｄ函数，简称Ｓ型函数，其特点是函数本身及其导数是连续的，因而在处理上十分方便．单极性ｓ型函数定义如下：ｍ）２寿双极性Ｓ型函数的形式为八力‘４石）＠力等”北京摄装学院硕士学位论文这两种函数的图形如图２１所示：ｋ，（善）。ｌ，（ｘ）。／，工ｌ／，／／Ｏ，／。图２Ｉ．ｂ双极性ｓ型交换函数图２１．ａ单极性ｓ型变换函数（４）概率型变换函数图２２所示的是概率型变换函数，又称高斯型函数，可以表示为：／（力＝Ｐ－（，居２，ＪｑＪ。／‘ ‘＼。图２２概率型变换函数４．２．３．２两络的拓朴结构决定人工神经网络整体性能的另一大要素是神经元的连接形式，即网络的拓扑结构。根据神经元的连接方式可将神经网络分为两大类，即层次型结构和互联型结构。（１）层次型结构层次型结构中，神经网络将神经元按功能分成输入层、中间层（也称隐层）和输出层等若干层，各层顺序相连。可细分为三种典型的结合方式，即单纯型层次网络结构、输出层到输入层有连接的层次网络结构以及层内有互联的网络结构。分别如图２３和图２４以及图２５所示（见下页）。在图２３所示的层次型结构中，各层神经元接收翦一层输入并输出到下一层，层内神经元之间不存在连接通路。在图２４所示的层次型结构中，输入层神经元可以接收输出层的反馈。在图２５所示的层次型结构中，层间神经元有连接关系，增强了神经元网络的可控性。北京服装学院硕士学位论文图２３单纯型的层次型结构图２４输出层到输入层有连接的层次型结构图２５层内有互连的层次型结构（２）互联型结构互联型结构中，任意两个结点之间都可能存在连接路径。因此可以根据网络中结点的互连程度将互联型网络结构细分为三种情况。即：全互联型、局部互联型以及稀疏互联型。另外根据网络内部的信息流向，可以分为两种类型。即前馈型神经网络和反馈型神经北京服装学院硕士学位论文网络。多层前馈神经网络是由简单神经元构成的具有明显层次结构的网络模型，因其网络的信息处理方向是从输入层到各隐层再到输出层逐层进行而得名。它具有良好的非线性品质，灵活而有效的学习方式，完全分布式的存储结构，能进行大规模并行信息处理，对非线性系统具有较强的模拟能力。理论与应用研究表明，用前向神经网络能较好地满足函数逼近的有关要求ｆ２７Ｊ。图２３即是一种前馈型神经网络。目前应用最为广泛的ＢＰ网络，就是一种前馈型的神经网络。反馈型神经网络顾名思义，一般情况下凡包含反馈连接的网络均称为反馈网络。反馈连接即是一层韵输出通过连接权值送雷到同一层或前一层的输入ｌ捌。图２４和图２５所示的均为反馈型神经网络。４．２．３。３神经网终的学习规则神经网络的学习规则是决定其整体性能的另一大要素。通常的学习是指根据与环境的相互作用而发生的行为改变。其结果导致对外界刺激产生反应的新模式的建立。所谓神经网络的学习足指，通过对样本的学习训练，不断改变神经网络的连接权值以及拓扑结构，以使网络的输出不断地接近期望输出的过程。由于神经网络的学习规则不仅反映权值调整策略，而且与神经网络的指导信号有关。所以首先介绍根据指导信号类型的一种分类方法，根据指导信号类型可将神经网络的学习算法归纳为三类，即；有导师信号的学习、无导师信号的学习以及灌输式学习。然后介绍权值调整的规则。这些规则包括：Ｈｅｂｂ学习规则、感知器学习规则、最小均方学习规则、胜者为王学习规则等。有导师信号的学习也称监督学习，这种学习模式采用纠错机制。在学习的过程中需要不断地给网络成对地提供输入模式和正确的输出模式，即导师信号。将神经网络的实际输出与期望输出进行比较，当网络的输出与期望的导师信号不符时，根据差错的方向和大小按一定的规则调整权值，以使下一步网络的输出更接近期望结果。经过一定步数的迭代，完成网络的学习。无导师信号学习也称无监督学习，在学习的过程中，需要不断地给网络提供动态输入信息，网络根据特有的内部结构和学习规则，在输入信息流中发现任何可能存在的模式和规律，同时根据网络的功能和模式信息调整权值，这个过程称为弼络的自组织，其结果是使网络能对属于同一类的模式进行自动分类。在这种学习模式中，网络的权值调整不取决３７北京服装学院硕士学位论文于外来教师信号的影响，可以认为网络的学习评价标准隐含于网络的内部。灌输式学习是指将网络设计成能记忆特别的例子。以后当给定有关例子的输入信息时，例子便被回忆起来。灌输式学习中的网络值不是通过训练形成的，而是通过某种设计方法得到的。一旦设计好之后就不再变动。根据权值调整的策略将学习算法分为以下几种方式，下面以图２６为例进行说明。ｏ影，● ● ，、●ｔ【ｔ勺吒图２６权值调整过程（１）Ｈｅｂｂ学习规则１９４９年心理学家Ｄ．Ｏ．Ｈｅｂｂ提出了神经网络联想式学习规则，后来被称为Ｈｅｂｂ学习规则。在这种规则下，学习信号简单地等于神经元的输出。，＝，（∥，ｘ）权向量的调整公式为：（４?９）△矿』＝７，（∥，ｚ）ｚ权向量中每个分量的调整由下式给出：（４－ｌｏ）△ｗｊ，，＝，７．厂（町石）而（４－１１）其中，ｉＩ锈…，弗，ｊ＝ｏ＇…，臃。，ｌ和拼分别为输入神经元的个数以及输出神经元的个数，ｒ即该神经元的输出，／是作用函数，孵表示连接权值向量，ｘ是输入向量，，７是比例因子。Ｈｅｂｂ学习规则代表一种纯前馈、无导师信号学习．该规则至今仍在各种神经网络模型中起着重要作用。（２）感知器学习规则ｌＢ北京服装学院硕士学位论文感知器（Ｐｅｒｃ印∞ｎ）是１９５８年美国学者ＦｍｎｋＲｏ锨ｌｂｌａｎ首次定义的一种具有单层计算单元的神经网络结构。在这种模型中，学习信号等于期望输出（教师信号）与实际输出之差。，．＝嘭一巳（４．１２）式中西是期望豹输出；巳是实衔；输出，等于，（■ｘ）?感知器的变换函数为：叫耻洲和：０。嚣因此权值调整公式为：㈤，（４＿１４）Ａ％＝玎［乃一ｓｇｎ（吖石）］ｘ则单个的权值调整为：△ｗ∥＝印【西一吲彳】砑（４．１５）感知器学习规则代表一种有导师信号学习。由于感知器理论是研究其他神经网络的基础，所以该规则对于神经网络的有导师信号学习具有极为重要的意义。（３）最小均方学习规则最小均方规则是１９６２年ＢｅｒＩｌａｒｄＷｉｄｒｏｗ和Ｍ甜ｃｉ姐Ｈ０行提出的一种学习规则，它能使神经元实际输出与期望输出之间的平方误差最小，因此得名。ＬＭＳ的学习信号为：ｒ＝４一∥石权向量调整量为：（４?１６）△彬＝Ｊ７（西一町ｚ）ｘ（４．１７）其中△彤的各分量为：△坳＝，７瞄?彤２ｘｋ（４．１８）该学习规则与神经元采用的变换函数无关，因而不需要对变换函数求导数，不仅学习速度快，而且具有较高的精度，权值可初始化为任意值。 “）胜者为王学习规则胜者为王（ｗｉｎｎ盯．Ｔａｋｃ．Ａ１１）学习规则是一种竞争学习规则，用于无导师信号学习。３９北京服装学院硬士学位论文做法是，将网络的某层确定为竞争层，对于一个特定的输入Ｘ，竞争层的所有＿，个神经元均有输出响应，其中响应最大的神经元工为在竞争中获胜的棒经元，即彬Ⅳ＝ｍ缸（形。柳，ｆ＝１，２，…，疗只有获胜的神经元才有权调整其权向量，调整量为：△阡，一＝口（Ⅳ一降■）（４－１９）（４－２０）其中Ｏ＜口＜ｌ，是一个小的比例常数，一般随着学习的进展而变小。这种网络具有很好的分类效果，在反复的竞争学习过程中，竞争层的各神经网络所对应的权向量被逐渐调整为输入样本的聚类中心。取值也可初始化为任意值。（５）其他学习规则上面是四种常用的学习规匝！ｊ，另外的学习规则，比如相关学习规则，外星学习规则等很少用到，这里就略去不再介绍。以上介绍了神经网络的三个组成部分，即神经元（信息处理单元）的特性，网络拓朴结构以及学习规慰。三个部分钓不同组合就构成了具有不同功能类型的神经网络，４．３ＢＰ神经网络４．３．１多层感知器神经网络１９５８年，美国心理学家Ｆ删［１ｌ【Ｒｏ辩ｎｂｌａｔｔ提出了一种具有单层计算单元的神经网络，称为ＰｅｒｃｅＤ们ｎ，即感知器。感知器的研究其对神经网络的发展起了重要的推动作用，但是随着研究的深入，发现单计算层感知器只能解决线性可分问题，而大量的分类问题是线性不可分的。后来Ｋｏｌｍｏｇｏｆｏｖ指出，双隐层感知器足以解决任何复杂的分类问题。在１９８６年，融ｌＩｎｅｌｈａｎ和Ｍｃｃｅｌｌａｎｄ等在《平行分布处理》一书中，首次对非线性连续变换函数的多层感知器的学习算法进行了详尽的分析，实现了Ｍ扛蟮ｋｙ关于多层网络的设想。多层感知器神经网络由三部分组成，即输入层、一个或多个隐层以及输出层。图２７给出了包含单隐层的感知器神经网络以及隐层神经元的模型。４０北京服装学院硕士学位论文图２７．ａ单隐层感知器神经网络图中，ｆ＝０，ｌ，…，以，．，＝Ｏ，ｌ＇…，ｍ，七＝ｌ，…，，：图２７．ｂ隐层神经元的模型疗、所、，，分别为神经网络的输入层、中间层和输出层神经元的个数；而，儿均为一１，是为引入阈值而设的；薯，表示这个神经元的第ｆ个输入：％，是连接第ｆ个输入和第，个神经元的输入权值；∑，表示神经元对输入信号的加权处理；，（∞，是神经元的激活函数；只即第，个神经元的输出，可表示为：ｙ，；厂（砉ｖ．）其中厂（工）通常取单极性ｓｉｇｍｏｉｄ函数?４．３．２标准ＢＰ算法ｊ㈣对于误差反馈的作用，人们早已有了深刻的认识，并且已经应用到了诸多领域，比如在控制领域中，利用输出信号的反馈实现对设备的控制；在电路系统中，利用输出电信号韵反馈实现信号放大等；多层感知器神经网络，是其中一个经典应用领域。在多层感知器网络中，误差反馈调节（ＥｒｒＤｒＢａｃｋ慨撕０ｎ）算法简称为ＢＰ算法。下面以三层感知器为例介绍标准的ＢＰ算法。该算法分为两个阶段．第一阶段是正向传播，第二阶段是反向传播。在正向传播过程中。对于输入信号，要先向前传播到隐结点，经过作用函数后，再把隐结点的输出信息传播到输出结点，最后给出输出结果，其中每一层神４ｌ经元的状态只影响下一层神经元的状态。如果在输出层不能得到期望输出，则转入反向传播，将误差信号沿原来的连接通路返回，通过修改各层神经元的权值，使得误差达到期望值，即完成训练过程。（１）信号正向传播过程以４．３．１节中介绍的多层感知器为例，在图２７中。设网络的输入结点数为月，隐层结点数为ｍ，输出层结点数为，。为了便于叙述，把各层的信号用向量形式表示，其中权值为矩阵形式。则：输入向量：ｚ＝（ｘｌ，ｘ２，．．．，ｘ『’．．．，ｘ。）１，隐层输出向量：ｙ＝（蜘儿，．．．，”，．．．，％）’，输出层输出向量：０＝（Ｄｌ，Ｄ２，．．．，Ｄ∥．．，Ｄ，）７，期望输出向量：ｄ＝（盔，ｄ：，…，反，．．。，矾）７，输入层到隐层的权值矩阵：ｙ＝（巧，吃，．．．，巧，．．．，圪），隐层到输出层的权值矩阵；矽＝（彬，％，．．．，％，¨．，形），其中矿是隐层第＿，个神经元对应的权向量，％为输出层第七个神经元对应的权向量?则对于输出层，感知器的输出：Ｄ。＝，（疗ＰｆＩ），后＝Ｉ，２，．．．，，（４。２２ａ）其中，ｌｅ‘为输出层第七个神经元的输入加权和：以ｅｆ｝＝∑ｗｍｙ，，ｎｅｔｋ。乙ｗＪＩｙｊ，Ｊ＝ＯＲ２ｌ，ｊ厶…，ｌＩｉ｝＝ｌ，２，．．．，，（４－２２ｂ）对于隐层有：ｙ／＝，（”Ｐｆ』），，＝ｌ，２一．，珊（４－２３ａ）其中朋‘为隐层第＿，个神经元的输入加权和：胛订ｆ＝∑％一，ｎｅ｜Ｊ５乙ｖｑｘｌ，扫Ｏ＿，＝１，２，．．．，肌ｊ２１，ｊ２…?＇ｍ（４?２３ｂ）那么，当网络的输出与期望输出不相等时，即存在输出误差，则定义网络的第女个输出神经元的误差函数臣为：北京服装学院硕士学位论文乓＝去似一ｑ）２则网络的能量函数（总的输出误差）为：件２４）Ｅ；昙壹（畋一吼）２（２）误差反向传播过程（４．２５）利用误差反馈，通过调整权值和阙值，使当能量达到最小时，网络趋于稳定状态，学习结束。求解无约束最优化方程（４―２５）的常用方法有：牛顿迭代法、拟牛顿迭代法、最佳檬度下降法等。但前两种方法涉及矩降求逆。其计算量大，医此本文采用后一种方法调整权值。首先推导出能量函数与隐层和输出层之间权值的关系，将式（４?２２）代入能量函数表达式（４．２５），则有Ｅ＝吉∑（以一，（疗Ｐ‘））２＝｛∑Ｉ吃一厂（∑％乃）ｌ（４－２６ａ）Ｅ：昙圭似一，（疗ｅ‘））２：昙壹Ｉ吃一厂（芝％乃）ｌ（铊６ａ）二Ｊ－ｌ二Ｉ＿ｌｌ，。ＯＩ迸一步将其展开至输入层，将式（４．２ｊ）代入（４－２６ａ），可得西＝三喜ｐ一厂陲％，（哟）］｝２＝三喜ｐ一，匡吖陲吩薯）］）２（４－２６ｂ）可见能量函数Ｅ是各层间权值％和屹的函数，那么调整权值即可改变误差Ｅ?使用梯度下降法对其进行调整，对Ｍｋ和～分别求偏导啦：要：要警嵋２瓦２丽茁△Ｍ：＝巾―――－ｏ战：要：．要警５如口阮ｔ｜ａｖｑ睁２７ａ）（４．２７ａ）睁２砌ｌ斗。Ｚ，ＤＪ１ ‘显然权值调整的原则是误茬不断减小，因此应使调整量为梯度下降的方向。则在网络训练过程中，各层权值的诵整量为△ｗ。：１≤生宴堕 △％叫丽茁‘４。２聊（４－２８ａ）‰：１要警嘶叫面ｉ睁弱∞ （４－２８”北京服装学院硕士学位论文瓦甲负号表不梯厦Ｆ降的方同，常数Ｏ＜，７＜１为调整的步长，驯嗍络训练中的学习运翠?将式（４．２８ａ）进行整理，把其表达为物理意义更明确和更易于实现的形式。如果在上述网络隐含层和输出层中，激活函数均使用单极性ｓｉｇｍｏｉｄ函数，（工）＝ｌ／（１＋Ｐ。）那么，‘（曲＝厂（工）［卜，（明由式（４－２２ａ），将激活函数引入输出层得（４－２９）矗２，‘慨）２ｑ（１一。ｔ）而能量函数对于输出层输出的导数（４－３０）罢－－（咖）则有（蝴）鲁：要鲁：一（瓯吨）％（１一吼）孙ｅｔｋ∞ｋ翮ｅｌｋ、Ｉ”‘、Ｉ’（４．３２）、‘同时，输出层输入对于隐层权值的导数篑＝乃那么。将式（４．３２）和（４．３３）代入（４―２８ａ），则有㈣（４?３４ａ）△＿％＝可瓯乃＝叮（喀一吼）吼（卜‘吼）乃由同样的方法对（４―２８ｂ）处理，可得厂，Ｌｔ－Ｉ１△％＝，｝岛ｔ＝蟹ｌ∑溆一％）呸（１一吼）、％ｌ乃（１一ｙ，）ｔＪ（４．３４协其中４表示输出层的误差，ｔ表示隐层的误差，有磊＝一盖＝（喀一ｑ）吼（１一吼）（４．３５ａ）铲盖＝阻－ｏ＾）０Ｉ（１训％Ｍ一的）（４．３ｓｂ）这就是在标准ＢＰ算法下，多层感知器的学习过程中网络权值的调整方式。式“．３４）北京服装学院硕士学位论文是网络权值的调整量。可以看出ＢＰ学习算法中参数由三部分构成，即：学习速率叩、本层输出的误差信号万以及本层输入信号。４．３．３使用标准ＢＰ算法的感知器神经网络应用误差反传学习算法例的多层感知器神经网络，被称为ＢＰ神经网络，该网络可将一组样本的Ｉ，Ｏ问题转化为一个非线性优化问题，并可近似实现从输入到输出的任意连续的非线性映射。对于ＢＰ网络，按照第４．３．２节中的导出的权值修正方式修正网络权值，进行学习训练，当系统的能量达到最小时，网络趋于稳定状态，学习结束。本文设计的ＢＰ网络训练过程为：（１）初始化将权值、阊值初始化为Ｏ～１之阃的随机值，样例计数器Ｐ和训练次数计数器碍置ｌ，误差Ｅ初始化为Ｏ，设定学习速率，７为Ｏ～ｌ之间的小数。（２）选择训练样例首先标定训练样例，方法是选取输入向量墨，．．，，以，然后将与此对应的期望输出为标记为嘎，．．．，以。最后选择一定数目的调练样例即可。（３）计算网络的输出误差设共有，对训练样例。网络对于不同的训练样例具有不同的误差Ｅ９＝√∑：，。（群一《）２?将全部样本输出误差的平方（∥）２进行累加再开方，采用均方根误差Ｅ眦２括∑二（明２作为网络的总误差。（４）计算各层的误差信号应用式（４－３５ａ）和（４＿３５ｂ）计算各层的误差信号。（５）根据误差信号调整权值应用式（４．３４ａ）和（４．３４ｂ）计算输入层和隐层之间权值矿以及隐层和输出层之间的权值矿中各个分量。（６）检查是否所有的样例都使用过一次北京服装学院硕士学位论文着ｐ＜户（ＪＰ为训练样例的个数），计数器，和ｇ各增１返回（２），否则进行下一步。（７）检查网络的训练精度及训练终止条件当完成一轮训练之后，如果Ｅ。。＜玩。，则训练达到精度，算法终止。其中￡二。为要求的训练精度。否则作如下几个判断：（１）训练次数是否达到预先设定的最大值；（２）是否达到最大训练时间：（３）能量函数梯度降是否达到最小值；（４）连续验证失败次数超过最大次数。如果满足任意一个，则算法终止，否则返回（２）。４．４ＢＰ神经网络算法的缺陷和改进４．４．１标准ＢＰ算法存在的缺陷神经网络的信息处理能力不仅取决于神经元之间的连接强度，而且与网络的拓扑结构有关。ＢＰ算法本质上可以看作是ＬＭＳ准则在多层前馈神经网络中的应用，它采用的是非线性无约束极值问题求解方法中最基本的方法――梯度法（最速下降法）。因此，ＢＰ算法存在一些限制与不足，其主要表现在下面几个方面：（１）易形成局部极小，而得不到全局最优ＢＰ算法采用的是梯度下降法，可能存在局部极小问题，即ＢＰ算法可使网络权值收敛到一个解，但它并不能保证所求的解为误差超平面的全局最小解，很可能是一个局部极小解。在用它解决稍复杂的问题时，误差函数可能陷入一个局部极小区域，由此点向各方向变化均使误差增加，从而使网络训练无法跳出这一局部极小值，致使学习过程失效。（２）学习效率低其原因有三：一是网络的学习速率太小所造成的；二是当输入量过大或过小时应用梯度下降法训练网络，其梯度数量级也会很小，从而使得权值和阈值的调整范围很小，常常会使网络陷入“瘫痪”状态。三是标准ＢＰ算法采用的误差函数％＝√∑：。（∥）２／Ｐ，随着学习的进行，误差越来越小。也使得学习速度减慢。（３）网络隐含层节点数及初始权值的选取这些参数的选取对网络的收敛有较大影响，但它们的确定缺乏足够的理论指导，通常是根据经验选取。因此往往受设计者的经验影响较大。 “）新加进的学习样本会影响已有的学习效果。“‘。。●＿＿＿＿＿●－。。。。。。●●＿●＿－＿。。＿。一北京服装学院硕士学位论文４．４．２对ＢＰ算法的改进如上所述，由于ＢＰ算法存在一些缺陷，针对这些问题，近几年来不少学者在如何加速ＢＰ网络的收敛速度和尽量避免陷入局部最小等方面作了大量的工作，本文主要采用以下三种方式对算法进行改进。（１）加动量项在修正网络权值时，不仅考虑误差在梯度上的作用，而且考虑在误差曲面上变化趋势的影响。标准ＢＰ算法在权值调整中，只按ｔ时刻误差的梯度降方向调整。而没有考虑ｔ时刻以前的梯度方向，从而常使训练过程发生振荡，收敛变慢。为了提高网络的训练速度，可以在权值调整公式中增加一动量项。△形（ｆ）＝枷Ｘ＋ａ，△形Ｏ―１）（４．３６）式中，口称为动量系数，一般有Ｏ＜口＜ｌ。从前一次权值调整量中取出～部分叠加到本次调整量中，口影响这个调整量的大小，对于ｔ时刻的调整起到阻尼的作用。现在，ＢＰ算法中都增加了动量项，有动量项的ＢＰ算法已成为一种新的标准算法。（２）动态改变学习速率动态改变学习速率有利于缩短学习时间。学习速率选得太小，收敛太慢；学习速率选取得太大，则有可能修正过头，导致发散。因此出现了自适应调整的改进算法，学习速率的改变方法很多，其目的都是使其在整个训练过程中得到合理调节，下面给出本文使用的方法。令水ｔ＋１）＝∥衣ｔ）“一３７）上式表示两个时刻学习速率的关系，式中ｐ是指学习速率的改变量。设定一初始学习速率，若经过一批次权值调整后使总误差变大，则本次调整无效，减小学习速率值；若经过一批次权值调整后使总误差变小，则本次调整有效，适当增大学习速率值。（３）弹性梯度下降法标准ＢＰ网络的隐含层通常采用ｓｉｇｍｏｉｄ型作用函数。但是这类函数在应用的时候存在很大的缺陷，当输入量过大或过小时应用梯度下降法训练网络，其梯度数量级也会很小，从而使得权值和阔值的调整范围很小，常会造成即使没有达到最优值训练也会终止的后果。基于此，本文对标准的ＢＰ网络算法进行了改进，使用弹性梯度下降法（ＲＰＲＯＰ）对４７北京强装学院硕士学位论文网络进行训练。在弹性梯度下降法中，权值修正取决于误差函数导数的正负号．而不受导数大小的影响，因此能够防止因调整过缓而导致的网络训练终止。其原理如下，权值变化的大小由不同的修正值决定。当两次训练时的导数的正负号没有改变时，权值和阈值的修正值增加；当两次训练时导数的符号有改变，则权值和阈值的修正值减小；如果导数为Ｏ．则修正值不变。这样调整的结果是，权值的变化呈振荡趋势，不过权值变化量逐渐减小。如果权值变化连续几次都在同一个方向，则增加权值变化的数量级１３０Ｊ。４．５基于改进的ＢＰ网络的字符识别系统设计目前，常用的神经网络主要有ＢＰ神经网络、Ｈｏｐｆｉｅｌｄ网络、ＫＤｈｏｎｅｎ网络等。网络类型的选取依据主要是待分类样本的类型和数量。出于对车牌照字符特点的考虑，本文采用的是ＢＰ神经网络。本文结合第三章介绍的字符特征提取方法，提出了一种基于投影变换和弹性ＢＰ神经网络的字符识别方法。根据这种方法设计字符分类器，构建字符识别系统。４．５．１字符识别系统的构成在第二章中介绍过，目前中国境内使用的多是９２式车牌，最近部分地区推出的个性化车牌，由于其不具有普遍性，所以文中没有进行专门研究。９２式这种车牌字符由汉字，英文字母和数字组成，所以如果将所有的字符混合在一起分类，一方面会使识别率降低，另一方面训练时间会很长。但是根据规定，车牌字符有这样一个特征；第一个字符是汉字，为各省市的简称，如：“京”、“冀”、“鲁”等，第二个字符是大写英文字母，如“Ａ”、‘‘Ｂ’’等，第三个字符是英文字母或者是阿拉伯数字，第四至第七个字符均为阿拉伯数字。因此本文将子分类器分为四个：汉字分类器，英文字母分类器。英文字母和数字混合分类器以及数字分类器，这种神经网络设计可以有效简化网络结构，提高识别精度和速度，多分类器的系统的构成如图２８所示。４９托京服装学院硕士学位论文――一汉字分类器卜―一Ｉ车牌【字符字符特征提取ｌ图像一字母分类器ｂｌ字母和数字ｆ１混合分类器ｒｊ字符识别结果―――一数字分类器卜―一图２８多分类器系统框图在众多应用环境中，特征提取、分类器和多分类器集成是整个识别系统的核心。本文的特征提取使用一种综合特征。把第三章介绍的基于投影交换的字符特征提取方法和字符行列特征综合，做为分类器的输入。分类器的集成方式如上圈所示，这就完成了字符识另哩系统的构造。４．５．２字符识别算法流程根据改进的ＢＰ网络算法，结合本文提取的字符特征，给出本文程序的流程图，如图２９所示（见下页）。在ＭＡｌ阻ＡＢ中编程实现该算法。将程序流图中的关键步骤说明如下：（１）程序入口处的初始化是指权值和阁值以及相应计数器的初始化；（２）网络训练成功后，程序的返回数据为该ＢＰ网络的权值和阙值；（３）关于条件判断，第二个判断指示训练是否成功，满足该判断条件则认为网络训练成功，第三个判断指示训练是否失败，这些条件是一系列的网络训练终止条件，其中包括最大训练次数限制、最大训练肘闯限制、能量函数梯度降最小值以及连续验证失败次数限制，满足其中任何一个，则终止网络训练，同时认为训练失败；（４）关于误差反馈过程，此处进行权值的调整，本文在这个地方加入了对ＢＰ神经网络的改进算法。北京服装学院硕士学位论文图２９ＢＰ算法的程序流图４．５．３网络参数的选取在自组织神经网络中，其结构和参数是可以自学习的。但是在ＢＰ神经网络的讽练过程中恰恰相反，很多参数需要预先设定，因此网络参数的选取是个十分重要的环节。如上所述，本文设计了多分类器字符识别系统，因此应针对每个分类器设计相应的参数。下面给出参数的选取情况。（１）输入层神经元节点数输入层神经元节点数根据所提取的字符特征量的维数来确定。在第三章中提取的车牌５０托京驻装学院硕士掌位论文照字符特征向量为５６维，故这些分类器的输入层节点数均为５６个。（２）输出层神经元节点数输出层神经元节点数由待分类模式的总数决定。针对各个分类器的识别任务不同，节点数也不相同。字母分类器２４个（车辆牌照中的字母为除“Ｉ”、“Ｏ”之外的其他２４个字母），字母数字混合分类器３４个，数字分类器ｌＯ个。对于汉字分类器，由于车辆牌照中的汉字为车辆登记的地名等信息，在每个地区均具有该地区的聚集性，因此在北京取得的样本中绝大多数均为“京”字。为了兼顾样本的丰富性，尽量地采集了其他地区的车辆牌照。比如。冀”、“鲁”、“蒙”、。辽”、。津”、“苏”、“吉”和“黑”等。一共９种字符，故汉字分类器的输出节点数为９个。（３）隐层个数神经网络的许多特性正是由于隐含层的存在才具备。通常隐含层为一层到二层时具有最好的收敛性质，没有隐含层和隐含层层数太多的收敛效果均比较差。虽然双隐层的ＢＰ网络能够解决任何复杂的分类问题，但是由于多隐层ＢＰ网络需要较长的训练时间，所以本文采用了具有～个隐含层的三层ＢＰ神经网络。（４）隐含层神经元数目当用神经网络实现映射时，确定隐含层神经元数是至关重要的。隐含层神经元个数的过少或过多将导致神经网络的学习能力不够或归缡能力下降；隐含层神经元数县较少对，网络每次学习时间相对较短，但有可能因网络映射容量不够而使网络不能很好学习，从而导致权值疲千来回调整而无法达到全局最小，网络训练精度也不高；隐含层神经元数目较大对，学习缝力褥烈增强，但飘绍每次弧练所需的学习时阊榴对较长。甄络所需的存储容量也随之变大。另外，网

苏h8a939车牌在上海2o13k经典电影网年违章记录

我要回帖

更多关于三星2o13主板多少钱的文章

随机推荐

苏h8a939车牌在上海2o13k经典电影网年违章记录

我要回帖

更多关于 三星2o13主板多少钱 的文章

随机推荐

更多关于三星2o13主板多少钱的文章