今天和搜索部門一起做了一下MQ的遷移,順便交流一下業(yè)務(wù)和技術(shù)。發(fā)現(xiàn)現(xiàn)在90后小伙都挺不錯(cuò)。我是指能力和探究心。我家男孩,不招女婿。
在前面的文章中也提到,我們有媒資庫(kù)(樂視視頻音頻本身內(nèi)容)和全網(wǎng)作品庫(kù)(外部視頻音頻內(nèi)容),數(shù)據(jù)量級(jí)都在千萬(wàn)級(jí)。我們UV,PV,CV,VV都是保密的。所以作為一個(gè)合格的員工來說………………數(shù)值我也不知道??傊?,這些數(shù)據(jù)作為最終數(shù)據(jù)源,要走一個(gè)跨多個(gè)部門的工作流才最終出現(xiàn)在用戶點(diǎn)擊搜索按鈕出現(xiàn)的搜索框里。大體流程圖如下:
這個(gè)流程圖之所以沒像以往一樣手繪,嗯,那是因?yàn)椋轰摴P放在公司了。
這里面除了兩個(gè)庫(kù)都在我們這邊之外,其他的一個(gè)框是一個(gè)部門。我們這邊給pipeline的數(shù)據(jù)交付使用的是我開發(fā)的離線服務(wù)。pipeline將各個(gè)來源的數(shù)據(jù)做重復(fù)歸并處理。就是一些視頻內(nèi)容是一樣的,但是可能來源不同或者名稱有相似但可能不完全相同,而實(shí)際上是一個(gè)視頻。打個(gè)比方,大學(xué)時(shí)看過一個(gè)電影叫<a Cinderella story>翻譯成中文有的翻譯成《灰姑娘的故事》也有翻譯成《灰姑娘的玻璃手機(jī)》,但是可以根據(jù)其導(dǎo)演和演員表等判斷其實(shí)是同一個(gè)視頻。這些相同的視頻要聚合成一個(gè)專輯。推舉最優(yōu)質(zhì)的描述作為專輯的描述。展開詳情有各個(gè)來源的排序后視頻列表。
正常全網(wǎng)搜索也會(huì)將自家的視頻放在前面:
延伸閱讀
- ssh框架 2016-09-30
- 阿里移動(dòng)安全 [無線安全]玩轉(zhuǎn)無線電——不安全的藍(lán)牙鎖 2017-07-26
- 消息隊(duì)列NetMQ 原理分析4-Socket、Session、Option和Pipe 2024-03-26
- Selective Search for Object Recognition 論文筆記【圖片目標(biāo)分割】 2017-07-26
- 詞向量-LRWE模型-更好地識(shí)別反義詞同義詞 2017-07-26
- 從棧不平衡問題 理解 calling convention 2017-07-26
- php imagemagick 處理 圖片剪切、壓縮、合并、插入文本、背景色透明 2017-07-26
- Swift實(shí)現(xiàn)JSON轉(zhuǎn)Model - HandyJSON使用講解 2017-07-26
- 阿里移動(dòng)安全 Android端惡意鎖屏勒索應(yīng)用分析 2017-07-26
- 集合結(jié)合數(shù)據(jù)結(jié)構(gòu)來看看(二) 2017-07-26