基于情感计算的消费体验数字化表征技术研究

known 发布于 2025-08-25 阅读(334)

中图分类号:TP391 文献标识码:A文章编号:2096-4706(2025)07-0129-04

Abstract: The consumers experience and felings are an important basis for product design. Because the consumption experienceisdificult toquantitativecharacterization,the productdesignobjectivesandevaluation criteriaareunclear.By takingthecigaretepackagingconsumption experienceastheresearch object,theconsumerreviewdata arecolected,and the text afective computing method based on Naive Bayes is studied.The consumption experience affective score is used to quantitativelycharacterize theconsumers experienceof the product.Furthermore, the keywords ofconsumption experience are excavated from two aspects of“positive”and“negative”,to help Ramp;D personnel accurately grasp consumersexperience evaluations andsuggestions onproducts,providing concrete design objectives and evaluation basis forproduct developmentand product upgrading.

Keywords: affective computing; consumption experience; digital characterization

0 引言

消费体验[是消费者使用产品或服务时体验到的感觉和情感。卷烟包装设计是消费者面对卷烟产品的第一环节,是能否吸引消费者购买的关键一环,直接影响了卷烟品牌的市场占有率。产品设计人员希望准确掌握消费者对卷烟包装的消费体验评价以及改进建议[2,从而指导产品包装的设计以及产品升级改造[。传统的做法通常是采用调研问卷、焦点访谈或拦截访问的方式[4],收集消费者对卷烟产品体验感受的描述信息,然后再交由调研分析人员逐条阅读、汇总并依靠大脑中的主观印象给出大体判断和总体评价,缺少定量的表征指标;时间长、成本高、效率低下,分析结果缺乏科学依据,更难以实现动态数据收集和持续跟踪监控。同时,由于没有一种定量表征卷烟产品消费体验的方法,消费者对卷烟产品的体验感受无法直接传递给产品研发人员,导致产品设计目标和评价依据均模糊不清,产品研发和提质改造工作无法做到有的放矢,与消费者的体验感受脱节,无法满足市场消费者对卷烟产品良好体验的要求。

文本情感计算是通过语义分析算法分析大量的语料文本数据,挖掘文本所描述的观点或倾向性[5],并进行数字化表征得到定量的情感分值[。众多国内外学者对语义分析算法进行了研究并取得了成果。Turney[提出了语义探测的挖掘方法,结合点互信息和信息检索方法对文本数据进行情感分类。Dave等[用语义探测方法研究产品评论情感分类。Chaovalit等比较了机器学习方法和语义探测方法在电影评论中的应用,研究结果显示了语义探测方法在情感分类中的优越性。Ye等[]提出了用语义学方法对中文电影评论进行情感分类,取得了很好的效果。

陈希雅等[选择纯棉针织布作为实验对象,组织7位受试者自由描述洗后织物手感,并通过相关性分析建立织物洗后手感的主观评价与客观测试的物理指标之间的关联,实现了消费者感受的客观评价。王一诺等[12]利用语义分析与因子分析模型,就客户对婴儿奶嘴、吹风机、微波炉的评论数据进行数据挖掘与特征提取,预测产品组合成功或失败的可能性。由丽萍等[13]采用词典和规则相结合的方法进行在线医疗评论的情感语义分析。

本文从如何有效指导产品研发或产品升级改造的角度出发,研究运用情感计算方法定量表征消费者对卷烟产品包装设计的体验感受并进行结构化分析,辅助研发人员准确把握消费者对产品体验的评价。并进一步研究运用关键词提取技术,从“积极”和“消极”两个情感极性分别挖掘消费者“喜欢”和“不喜欢”该产品包装设计的特征元素,以具象化的特征有效指导卷烟产品包装设计。

1 数据和方法

1.1 消费者评论数据集

针对国内某卷烟工业企业的产品规格A,通过第三方消费者调研平台,采集了8个省份20个地市的消费者对卷烟产品A包装设计的评论数据。消费者自由使用语言描述对卷烟包装设计的体验感受,但存在重复评论、无效评论、繁体字、表情符号等问题。因此,需要对消费者评论数据进行剔除重复和无效评论、表情符号以及将繁体字转换为简体等数据预处理,最终得到有效的消费者评论数据1201条,如表1所示。

表1消费者评论数据集

1.2 评论数据分词处理

中文是以“词条”为单位表征行文意思。因此,在文本情感计算前需要对消费者评论数据进行分词处理。本文选择基于马尔科夫模型(HMM)的结巴分词[14Python算法包进行分词,采用从右向左的逆向最大匹配算法获得分词的最大概率路径。消费者评论数据的结巴分词结果如表2所示,反斜杠后面的字母代表词性。

表2结巴分词结果

1.3文本情感计算方法

SnowNLP是一个专门针对中文文本进行情感分析的Python类库,并且自带通用词典和情感计算模型。本文采用基于朴素贝叶斯算法的 SnowNLP[15],以每个消费者的评论语句为计算单位,计算消费者对卷烟产品A包装设计的消费体验情感分值。假设评论语句中各个词语之间相互独立,即每个词语对情感极性分类的贡献是相互独立的,计算方法如下:

1)依据分词结果将全部评论语句表示为多个词语的组合, ,…, ,并按照一定比例划分为训练集和测试集。

2)对训练集中每个评论语句进行消费体验情感极性标注 积极,消极},并计算先验概率 $P ( C _ { ☉ } )$ 、

3)遍历训练集中的全部词语,计算每个词语分属于不同情感极性的概率

4)计算测试集中评论语句 X 所属情感极性的概率:

5)根据 ,确定评论语句 X 的情感极性为“积极/消极”。

1.4关键词提取算法

TF-IDF (Term Frequency-Inverse DocumentFrequency)是最为常用的一种关键词提取算法[16-17],它的原理是如果一个词语在某个文档中出现的频率高,但在其他文档中却很少出现,则认为该词语能够代表该文档的主要观点或特征,适合用于区分不同的文档。

单词频率(TermFrequency,TF)是指某个特定词语在一个文档里出现的频次。单词频率越高,表示该词语在文档中越重要。计算式为:

式中, 为词语 i 在文档 j 中的频率, 为词语 i 在文档 j 中出现的次数, 为文档 j 中的词语总数。

逆文档频率 (Inverse DocumentFrequency, IDF)是用来衡量某个词语在全部文档中存在的普遍性,是通过总文档数除以包含了该词语的文档数量再取对数得到的,计算式为:

式中: 为词语 i 在文档集中的逆文档频率,N 为全部文档总数, 为含有词语 i 的文档个数, 防止分母为 0 。

TF-IDF计算的计算公式如下:

2 结果与讨论

2.1消费体验量化表征

文采用SnowNLP基于朴素贝叶斯算法的文本情感分析模型,计算结果是一个 0 ~ 1 之间的分值:分值越接近于1,表示该条评论语句的情感极性越积极;分值越接近于0,表示该条评论语句的情感极性越消极。消费者评论语句的情感分值如表3所示。计算全部消费者评论情感分值的均值为 ,表明消费者对卷烟产品A包装设计的体验总体呈现较为积极的情感极性。绘制情感分值分布图,如图1所示,消费体验情感分值主要分布在 0 . 7 ~ 1 与 0 . 3 ~ 0 . 6 两个区域。结合消费者评论描述语言不难看出,消费体验在0.7分以上,表达出了消费者较为强烈的积极情感(占比 3 9 . 0 6 % );消费体验在0.3分以下,表达出了消费者较为强烈的消极情感(占比 4 . 4 6 % ),如图2所示。

表3情感计算结果

2.2卷烟包装设计消费体验特征提取

为有效指导卷烟产品包装设计的升级改造,本文运用基于TF-IDF的关键词提取算法挖掘消费者对卷烟包装设计特征元素的喜好。为了避免提取出“产品”“外观”“设计”“感觉”等出现频率高但实际意义不大的词语,通过引入停用词典在特征提取时进行过滤;同时,通过词性筛选过滤掉语气助词、副词、介词、连词等无效词语。将全部消费者评论数据按照情感极性划分为“积极”( 和“消极”( 两个数据集,从而分别提取积极和消极两个方面的卷烟包装设计特征,并分别生成关于卷烟产品A包装设计的“积极词云”和“消极词云”,如图3所示。

图3词云图

图2情感分值比例结构图

积极词云的前10个关键词以及对应的TF-IDF权重值分别为:大气(0.497113)、黄色(0.431358)、高端(0.35281)、盾牌(0.313937)、图案(0.191823)、颜色(0.18615)、漂亮(0.16783)、独特(0.167246)、高大(0.138006)、完美(0.131377)。将上述关键词关联到一起,表达了消费者喜欢卷烟产品A包装设计的特征为:黄色和盾牌是该产品包装设计的经典特征,图案、颜色等设计元素漂亮、独特、完美,显得高端、大气。

消极词云的前10个关键词以及对应的TF-IDF权重值分别为:颜色(0.788176)、黄色(0.248786)、不够大气(0.168386)、图案(0.146195)、不时尚(0.144726)、老气(0.140359)、缺乏现代感(0.116066)、太土(0.116066)、太暗(0.106896)、年轻人(0.10274)。将上述关键词关联到一起,表达了消费者不喜欢卷烟产品A包装设计的特征为:卷烟包装颜色“黄色”给人感觉较为沉闷,颜色太暗,感觉较为老气,不够吸引年轻人,图案设计简单,细节不足,缺乏现代感。

3结论

本文研究运用文本情感计算并结合关键词提取技术,定量表征消费者对卷烟产品包装设计的消费体验感受,从“积极”和“消极”两个方面提取卷烟包装设计消费体验感受特征。本文以国内某卷烟工业企业的产品规格A包装设计消费体验分析为例,通过第三方消费者调研平台采集消费者评论有效数据1201条,对数据进行分词、情感计算、关键词提取等分析处理,通过计算情感分值量化表征消费者对卷烟产品A包装设计的体验感受,对消费者的情感极性进行结构比例分析,并进一步挖掘消费者喜欢和不喜欢该产品包装设计的特征元素,以具象化的特征有效指导卷烟产品包装设计以及升级改造工作。

参考文献:

[1]比尔·摩根,文楚安.金斯伯格文选[M].成都:四川文艺出版社,2005.

[2]何杰.基于市场调研的七匹狼卷烟消费者市场细分研究[D].厦门:厦门大学,2014.

[3]瞿小阳,李晓娟,肖宁育,等.基于消费者体验的烟盒包装创新设计[J].湖南包装,2021,36(4):93-95+125.

[4]王浩.卷烟消费者追踪调查分析方法探讨及应用[G].北京:中国烟草学会,2015:868-874.

[5]PANGB,LEEL,VAITHYANATHANS.Thumbsup?Sentiment ClassificationUsingMachine Learning Techniques[C]//Proceedings of the ACL-02 Conference on EmpiricalMethodsin Natural Language Processing.[S.I.]:Association forComputational Linguistics,2002,10:79-86.

[6] KIM S M,HOVY E. Identifying Opinion Holdersfor Question Answering in Opinion Texts [J/OL].AmericanAssociation for Artificial Intelligence,2005:1-7[2024-09-23].https://cdn.aaai.org/Workshops/2005/WS-05-10/WS05-10-004.pdf.

[7] TURNEY PD. Thumbs Up or Thumbs Down? SemanticOrientation Applied to Unsupervised Classification of Reviews[C]/Proceedings of the 40th Annual Meeting on Associationfor Computational Linguistics.Philadelphia:Association forComputational Linguistics,2002:417-424.

[8] DAVE K,LAWRENCE S,PENNOCK D M. Miningthe Peanut Gallery: Opinion Extraction andSemantic ClassificationofProductReviews[C]//Proceedingsofthe12th internationalconference on World Wide Web.Budapest: Association forComputing Machinery, 2003:519-528.

[9] CHAOVALIT P,ZHOU L. Movie Review Mining: AComparison Between Supervised and Unsupervised ClassificationApproaches [C]//Proceedings of the 38th Annual HawaiiIntermational Conference on System Sciences.Big Island: IEEE,2005:112c-112c.

[10]YEQ,SHI W,LIYJ.SentimentClassification forMovie Reviews in Chinese by Improved Semantic OrientedApproach [C]//Proceedings of the 39th Annual HawaiiIntermational Conference on System Sciences (HICSs06).Kauia :IEEE,2006:53b-53b.

[11]陈希雅,陈祎宁,肖娜,等.基于语义分析的织物洗后手感消费者评价方法[J].毛纺科技,2023,51(6):123-131.

[12]王一诺,刘一帆,王宝珠.基于因子分析的亚马逊产品评价研究[J].投资与合作,2020(11):185-187.

[13]由丽萍,何玲玲.基于框架语义的在线医疗评论情感分析[J].现代情报,2020,40(3):111-116+125.

[14]邢玲,程兵.基于结巴分词的领域自适应分词方法研究[J].计算机仿真,2023,40(4):310-316+503.

[15]CHEN CX,CHEN J,SHI C.Research on CreditEvaluation Model of Online Store Based on SnowNLP[C]//ICAEER2018.Guilin:ICAEER,2018:537-540.

[16]张建娥.基于TFIDF 和词语关联度的中文关键词提取方法[J].情报科学,2012,30(10):1542-1544+1555.

[17] KUMARI M,JAINA,BHATIAA. SynonymsBasedTermWeighting Scheme:An Extension to TF.IDF [J].ProcediaComputer Science,2016,89:555-561.

作者简介,陈芳锐(1977—).女.汉族.云南曲靖人.

高级工程师,本科,研究方向:数字化设计;通信作者:胡月航(1984一),男,汉族,云南昆明人,高级工程师,硕士研究生,研究方向:数字化设计;尹志豇(1979一),男,汉族,云南曲靖人,高级工程师,本科,研究方向:数字化设计;田原(1986一),男,汉族,云南昆明人,高级工艺美术师,硕士研究生,研究方向:数字化设计;赵一鸣(1982—),女,汉族,陕西西安人,工程师,硕士研究生,研究方向:智能信息处理。

标签:  卷烟 

免责声明

本文来自网络,不代表本站立场。如有不愿意被转载的情况,请联系我们。

iidomino cuppor