当设计实例的相似程度比较低时,CBD的设计方法则不适用,且性能、结构和参数之间反映设计经验的映射关系包含在实例组织内,不利于设计经验的积累和传播。南方水泵厂观察到基于产品族的设计从约束角度反映设计知识,不能对设计过程进行指导,所以有必要寻求科学的计算模型和仿真模型,提高产品的自主开发能力。由于柴油机工作的特殊性,其性能优良与否取决于喷油、进气和燃烧三者之间的匹配,所以设计计算模型、喷射性能模型有许多经验公式和经验系数。这里,利用数据库知识发现(Knowledge Discovery in Database,KDD)技术原理,从以往的产品实例库、测试结论库中寻求产品特性、设计意图和设计知识。
经过多年的计算机辅助设计、生产、管理,以及数据库技术的广泛应用,产品开发部门已记录了大量有关产品开发的数据库,如设计任务特征库、产品明细表和油泵调试评价文件等。为了把设计过程中的潜知识转化为显知识,笔者采用数据库知识发现技术挖掘设计知识。KDD是从数据库中获取正确、新颖、有潜在应用价值和最终可理解的模式的技术。
油泵设计计算模型中有很多的经验系数,这些系数的选取直接关系到产品性能的好坏,以及设计方案的规模。利用设计任务特征库、产品明细表、调试评价结果和设计计算模型,重新计算以往的各种设计实例,可得到设计任务特征库、与任务特征对应的设计过程经验系数库、主关键参数库和设计方案评价结论库。通过KDD方法进行设计知识的挖掘,得到油泵设计中的知识。为此,东莞南方泵业指出油泵设计中数据挖掘的步骤:
1、选择和准备待发掘的数据。根据已有的产品设计要求、主关键参数和测试结论,反算各产品实例的设计经验系数;
2、数据预处理。建立关系数据库描述产品设计要求、主关键参数和测试结论,另建数据库描述相应产品实例的设计经验系数,通过净化、缩减、转化、分类等手段降低数据的复杂性,并重新加以组织;
3、选择相应的发现方法和算法,如分类、回归等;
4、实施发现算法,得到上述数据库之间的关联关系及可信度;
5、管理和维护知识,如检验知识的冲突等。
油泵设计过程中知识的发现是利用统计技术和数据库技术进行面向属性的操作,是对属性之间关系的认识和发现活动。其中主要有剪支、并支、找因果和找相关等方法。剪支是剪去对发现任务没有贡献或贡献率极低的属性域;并支是进行主成分分析,将相近属性进行综合;找因果是对数值表示的属性进行回归分析;找相关是进行因子分析,在取值无序且离散的属性之间寻找依赖关系。