您所在的位置:首页 > 其他 > 设计应用 > 融合多特征TFIDF文本分析的汽车造型需求提取方法
融合多特征TFIDF文本分析的汽车造型需求提取方法
2021年电子技术应用第2期
季曹婷,马伟锋,楼 姣,马来宾
浙江科技学院 信息与电子工程学院,浙江 杭州310023
摘要: 针对汽车造型智能设计领域中如何有效提取用户需求的问题,提出一种融合多特征TFIDF(词频-逆向文件频率)文本分析的汽车造型需求提取方法。首先,通过基于互信息与边界自由度获取大量未登录的专业词汇,优化和修正简单分词后的词汇;然后针对经典TFIDF算法的局限性,引入词汇特征因素与情感特征因素,获取用户需求特征候选集;最后根据设定的阈值得到有效的用户需求。实验结果表明,融合多特征TFIDF文本分析算法在特征提取方面有一定优势,能有效提取文本中关于汽车造型的用户需求。
中图分类号: TN02;TP391
文献标识码: A
DOI:10.16157/j.issn.0258-7998.200488
中文引用格式: 季曹婷,马伟锋,楼姣,等. 融合多特征TFIDF文本分析的汽车造型需求提取方法[J].电子技术应用,2021,47(2):16-19,27.
英文引用格式: Ji Caoting,Ma Weifeng,Lou Jiao,et al. An extraction method of car styling requirements by integrating multifeature TFIDF text analysis[J]. Application of Electronic Technique,2021,47(2):16-19,27.
An extraction method of car styling requirements by integrating multi-feature TFIDF text analysis
Ji Caoting,Ma Weifeng,Lou Jiao,Ma Laibin
School of Information and Electronic Engineering, Zhejiang University of Science and Technology, Hangzhou 310023,China
Abstract: In order to extract user requirements effectively in the field of car styling intelligent design, a method for extracting car styling requirements based on multi-feature TFIDF(word frequency-inverse file frequency) text analysis is proposed. Firstly, a large number of unregistered professional vocabularies is obtained through mutual information and boundary degrees of freedom to optimize the vocabulary after simple word segmentation. Next, in order to solve the problem of the limitations of the classic TFIDF algorithm, vocabulary and emotional feature factors are introduced to get user demand feature candidates set. Finally, effective user needs are obtained according to the threshold. The experimental results show that the multi-feature TFIDF text analysis algorithm has certain advantages in feature extraction, and can effectively extract user needs of the car styling in the text.
Key words : car styling;user needs analysis;keyword extraction;TFIDF

0 引言

    在智能制造的背景下,个性化生产是未来制造业发展的必然趋势,用户除了对商品基本功能的要求之外,个性化定制的需求正不断地增加[1]。汽车制造业是智能制造的典型应用行业,根据调查,我国超过七成的消费者认为汽车造型是决定购买汽车时的首要考虑因素[2],因此汽车造型能否符合用户需求是个性化汽车造型设计成败的关键[3]。目前,汽车造型的用户需求描述主要以文本数据形式存在[4]。自然语言处理技术是当前文本分析的主流方法,通常采用无监督方法进行自动关键词提取。但是该算法完全基于词频,忽略了词语其他特征对关键词提取影响的问题[5-7]。许多研究人员对此展开研究,赵晓平[8]等人提出文本结构特征与经典的TFIDF方法进行融合,应用于科技项目文本的相似度度量计算中;牛永洁[9]等人不仅考虑到词频,词跨度和位置权重特征,还考虑到词性,词长与语义关联度因素,相比经典的TFIDF算法有所改进;然而在实际应用中,不仅要考虑到词汇本身的特征信息,而且还需要考虑应用场景的问题。所以余本功[10]等人在解决问答社区关键词提取的问题时融合了词汇特征与社会化问答社区文本的用户关注属性来综合度量词语权重,提升了社区问答关键词提取的效果。

    虽然上述研究均取得了一些成果,但是无法有效地对汽车造型的用户需求文本进行提取。本文利用融合多特征TFIDF算法对用户需求文本数据进行分析,获取有效的用户需求特征,为汽车造型设计的需求确定提供支撑。




本文详细内容请下载:http://www.azcal.org/resource/share/2000003364




作者信息:

季曹婷,马伟锋,楼  姣,马来宾

(浙江科技学院 信息与电子工程学院,浙江 杭州310023)

此内容为AET网站原创,未经授权禁止转载。
Baidu