一个item“麦当劳”:被切词成“麦当 + 劳”
【代码】【code2image】使用bokeh画图,保存为png。
【代码】【code2image】使用bokeh画图,把文本画在图上。
VQ-VAE 里的 vector quatization。简单来说,就是要先有一个codebook,这个codebook是一个embedding table。我们在这个embeddin
【代码】调用Blip image tokenizer实现image2text。
【代码】【code2image】使用bokeh画图,读png并在图上加文本。
【代码】【code-draw】使用bokeh画图,去掉背景。
比如, 有100个特征,如果线上每个特征出问题的几率是1%,那么100个特征都不出问题的概率就是0.99^100 有200个特征,如果线上每个特征出问题的几率是1%,那么200个特征都不出问题的概率就是0.99^200把多个特征合并成一个特征,工程角度没问题的话,也会有效: 比如原来10个特征,每个成功率90%,现在合并成1个,成功率90%,相当于整体提升了, 比如10个长度10的array&l
Rule-based data cleaning is very important in rule-match and fuzzy-match algorithm.Everything is classification, so classification solves all. Also, e
Computers have been based on memory/storage for so many years. Don’t try to come up with something else.For so many years, AI has been based
【代码】python 曲线拟合。
即 nCr,which represents “n choose r”
objectA调用了objectB里面的一个方法methodB。objectB也调了objectA里面的一个方法methodA。可能是有两个Object:objectA,objectB。
加更多特征,特征一致性问题越大,则线上效果不好靠加特征提升。特征越多,特征一致性有问题的特征越多,
所以向量召回的结果起码会是BM25文本召回的补充。向量召回(做得好的话)的结果是。BM25文本召回的结果是。
Copyright © 2005-2024 51CTO.COM 版权所有 京ICP证060544号