针对文本分类数据非均衡问题,在数据层面提出一种新的基于大模型的样本平衡算法——LMSBA算法(Based on Large Model Sample Balancing Algorithm)。LMSBA算法是一种新型的样本平衡方法,旨在解决文本分类中的类别不平衡问题。该算法通...
详细信息
针对文本分类数据非均衡问题,在数据层面提出一种新的基于大模型的样本平衡算法——LMSBA算法(Based on Large Model Sample Balancing Algorithm)。LMSBA算法是一种新型的样本平衡方法,旨在解决文本分类中的类别不平衡问题。该算法通过生成少数类样本和筛选多数类样本,有效实现样本均衡化,同时利用特定提示词引导模型结合样本的生成与筛选。实验结果显示,在FastText、TextCNN、TextRNN和TextRCNN 4种文本分类模型上,LMSBA算法使宏平均F 1分数平均提高约37.37百分点,证明了其在处理非均衡样本问题上的有效性。
暂无评论