针对文本分类数据非均衡问题,在数据层面提出一种新的基于大模型的样本平衡算法——LMSBA算法(Based on Large Model Sample Balancing Algorithm)。LMSBA算法是一种新型的样本平衡方法,旨在解决文本分类中的类别不平衡问题。该算法通...
详细信息
针对文本分类数据非均衡问题,在数据层面提出一种新的基于大模型的样本平衡算法——LMSBA算法(Based on Large Model Sample Balancing Algorithm)。LMSBA算法是一种新型的样本平衡方法,旨在解决文本分类中的类别不平衡问题。该算法通过生成少数类样本和筛选多数类样本,有效实现样本均衡化,同时利用特定提示词引导模型结合样本的生成与筛选。实验结果显示,在FastText、TextCNN、TextRNN和TextRCNN 4种文本分类模型上,LMSBA算法使宏平均F 1分数平均提高约37.37百分点,证明了其在处理非均衡样本问题上的有效性。
接入级P2P(Peer-to-Peer)缓存容量设计回答在接入级ISP(Internet Service Provider)出口部署多大容量缓存的问题,目前还没有最优P2P缓存容量设计方法被提出.本文提出一种权衡存储成本和带宽成本的P2P缓存容量设计方法,以最小化ISP出口...
详细信息
接入级P2P(Peer-to-Peer)缓存容量设计回答在接入级ISP(Internet Service Provider)出口部署多大容量缓存的问题,目前还没有最优P2P缓存容量设计方法被提出.本文提出一种权衡存储成本和带宽成本的P2P缓存容量设计方法,以最小化ISP出口流量总花费为目标,将最优缓存容量设计问题描述为整数规划问题,其目标函数形式为单调阶梯函数,通过理论推导得出最优缓存容量计算公式指导接入级ISP进行缓存容量设计.将本文所提方法与Median和"20-80 Rule"等几种ISP常用的容量设计方法进行性能比较,结果表明,本文所提方法明显优于已有方法,与目前ISP最认可的"20-80 Rule"相比,应用本文所提方法的ISP出口流量总花费最多可降低7.5%.
暂无评论