大家見過這張圖嗎? Swami Chandrasekaran在2013年用地鐵圖來描述如何通過“一段旅程”來成為資料科學家 (鏈接:http://nirvacana.com/thoughts/2013/07/08/becoming-a-data-scientist/) 這個圖幫助很多人叩開了資料科學 ......
2022-05-08 more文章作者:阿里零售通演算法團隊 出品社區:DataFun 導讀: 零售通作為阿里巴巴新零售的八路大軍之一,肩負著“共建智能分銷平臺”和“讓百萬小店擁抱DT時代”的重要使命。一方面,我們通過線上平臺(零售通APP)將零售品牌商的貨品展現給小店的店主,并提供交易渠道讓店主進行批發進貨;另一方面,我們通過天 ......
2022-05-07 more環境準備 客戶端 Windows 10 ArcCatalog 10.8.1 精簡版Oracle Client 12 - 32 bit 安裝包名稱:instantclient-basic-nt-12.1.0.2.0.zip Navicat Premium 15 服務端 Windows Server 2 ......
2022-05-07 more線上服務的MongoDB中有一個很大的表,我查詢時使用了sort()根據某個欄位進行排序,結果報了下面這個錯誤: [Error] Executor error during find command :: caused by :: Sort operation used more than the ......
2022-05-07 more線上服務的MongoDB中有一個很大的表,我查詢時使用了sort()根據某個欄位進行排序,結果報了下面這個錯誤: [Error] Executor error during find command :: caused by :: Sort operation used more than the ......
2022-05-07 more環境準備 客戶端 Windows 10 ArcCatalog 10.8.1 精簡版Oracle Client 12 - 32 bit 安裝包名稱:instantclient-basic-nt-12.1.0.2.0.zip Navicat Premium 15 服務端 Windows Server 2 ......
2022-05-07 more文章作者:阿里零售通演算法團隊 出品社區:DataFun 導讀: 零售通作為阿里巴巴新零售的八路大軍之一,肩負著“共建智能分銷平臺”和“讓百萬小店擁抱DT時代”的重要使命。一方面,我們通過線上平臺(零售通APP)將零售品牌商的貨品展現給小店的店主,并提供交易渠道讓店主進行批發進貨;另一方面,我們通過天 ......
2022-05-07 moreEventTimeTrigger EventTimeTrigger 的觸發完全依賴 watermark,換言之,如果 stream 中沒有 watermark,就不會觸發 EventTimeTrigger。 watermark 之于事件時間就是如此重要,來看一下 watermark 的定義先~ Wa ......
2022-05-07 more一、Table API 和 Flink SQL 是什么 Table API 和 SQL 集成在同一套 API 中。 這套 API 的核心概念是Table,用作查詢的輸入和輸出,這套 API 都是批處理和流處理統一的上層 API,這意味著在無邊界的實時資料流和有邊界的歷史記錄資料流上,關系型 API ......
2022-05-06 more活動簡介 “開源之夏(英文簡稱 OSPP)” 是中科院軟體所 “開源軟體供應鏈點亮計劃” 指導下的一項面向高校學生的暑期活動,由中國科學院軟體研究所與 openEuler 社區共同舉辦。 2022 年為此系列活動的第三屆,開源之夏旨在鼓勵在校學生積極參與開源軟體的開發維護,促進優秀開源軟體社區的蓬勃 ......
2022-05-06 more**?桔妹導讀:**GPU虛擬機實體創建速度慢是公有云面臨的普遍問題,由于通常情況下創建虛擬機屬于低頻操作而未引起業界的重視,實際生產中還是存在對GPU實體創建時間有苛刻要求的業務場景。本文將介紹滴滴云在解決該問題時的思路、方法、并展示最終的優化成果。 從公有云服務商那里購買過虛擬主機的資深用戶,一 ......
uj5u.com 2020-09-10 06:09:13 more**?桔妹導讀:**隨著云規模不斷擴大以及業務層面對延遲、帶寬的要求越來越高,采用DPDK 加速網路報文處理的方式在橫向縱向擴展都出現了局限性。可編程芯片成為業界熱點。本文主要講述了可編程網卡芯片在滴滴云網路中的應用實踐,遇到的問題、帶來的收益以及開源社區貢獻。 #1. 資料中心面臨的問題 隨著滴滴 ......
uj5u.com 2020-09-10 06:10:21 more**?桔妹導讀:**滴滴資料通道引擎承載著全公司的資料同步,為下游實時和離線場景提供了必不可少的源資料。隨著任務量的不斷增加,資料通道的整體架構也隨之發生改變。本文介紹了滴滴資料通道的發展歷程,遇到的問題以及今后的規劃。 #1. 背景 資料,對于任何一家互聯網公司來說都是非常重要的資產,公司的大資料 ......
uj5u.com 2020-09-10 06:11:05 more**桔妹導讀:**深耕人工智能領域,致力于探索AI讓出行更美好的滴滴AI Labs再次斬獲國際大獎,這次獲獎的專案是什么呢?一起來看看詳細報道吧! 近日,由國際計算語言學協會ACL(The Association for Computational Linguistics)舉辦的世界最具影響力的機器 ......
uj5u.com 2020-09-10 06:11:29 more1、什么是mpp? MPP (Massively Parallel Processing),即大規模并行處理,在資料庫非共享集群中,每個節點都有獨立的磁盤存盤系統和記憶體系統,業務資料根據資料庫模型和應用特點劃分到各個節點上,每臺資料節點通過專用網路或者商業通用網路互相連接,彼此協同計算,作為整體提供 ......
uj5u.com 2020-09-10 06:11:41 more**桔妹導讀:**指標體系是什么?如何使用OSM模型和AARRR模型搭建指標體系?如何統一流程、規范化、工具化管理指標體系?本文會對建設的方法論結合滴滴資料指標體系建設實踐進行解答分析。 #1. 什么是指標體系 ##1.1 指標體系定義 指標體系是將零散單點的具有相互聯系的指標,系統化的組織起來,通 ......
uj5u.com 2020-09-10 06:12:52 more我們經常在資料庫中使用 LIKE 運算子來完成對資料的模糊搜索,LIKE 運算子用于在 WHERE 子句中搜索列中的指定模式。 如果需要查找客戶表中所有姓氏是“張”的資料,可以使用下面的 SQL 陳述句: SELECT * FROM Customer WHERE Name LIKE '張%' 如果需要 ......
uj5u.com 2020-09-10 06:13:25 more**桔妹導讀:**Ceph是國際知名的開源分布式存盤系統,在工業界和學術界都有著重要的影響。Ceph的架構和演算法設計發表在國際系統領域頂級會議OSDI、SOSP、SC等上。Ceph社區得到Red Hat、SUSE、Intel等大公司的大力支持。Ceph是國際云計算領域應用最廣泛的開源分布式存盤系統, ......
uj5u.com 2020-09-10 06:14:51 more之前寫過《es~通過ElasticsearchTemplate進行聚合操作》的文章,這一次主要寫一個嵌套的聚合,例如先對sex集合,再對desc聚合,最后再對age求和,共三層嵌套。 Aggregations的部分特性類似于SQL語言中的group by,avg,sum等函式,Aggregation ......
uj5u.com 2020-09-10 06:14:59 more傻瓜式部署,只需替換IP與用戶 導讀: 現ELK四大組件分別為:Elasticsearch(核心)、logstash(處理)、filebeat(采集)、kibana(可視化) 下載均在https://www.elastic.co/cn/downloads/下tar包,各組件版本最好一致,配合fdm會 ......
uj5u.com 2020-09-10 06:15:05 moreMysql復習的一個小總結,用xmind寫的。(字數沒有都不給我發博客😹) 下面是一些備注 子查詢 MySQL子查詢稱為內部查詢,而包含子查詢的查詢稱為外部查詢。 子查詢可以在使用運算式的任何地方使用,并且必須在括號中關閉。 視圖 基本語法可以使用 CREATE VIEW 陳述句來創建視圖。 語法格 ......
uj5u.com 2022-05-09 07:13:07 more?大資料概述 在大資料這個概念興起之前,資訊系統存盤資料的方法主要是我們熟知的關系型資料庫,關系型資料庫,關系型模型之父 Edgar F. Codd,在 1970 年 Communications of ACM 上發表了《大型共享資料庫資料的關系模型》的經典論文,從此之后關系模型的語意設計達到了 4 ......
uj5u.com 2022-05-09 07:13:01 more一、下載安裝IDEA IDEA2020.2.3版本:https://www.cnblogs.com/liugp/p/13868346.html 最新版本安裝詳情請參考:https://www.jb51.net/article/196349.htm 二、搭建本地hadoop環境(window10) 可 ......
uj5u.com 2022-05-09 07:12:17 moreMySQL8新增降序索引 桃花塢里桃花庵,桃花庵里桃花仙。桃花仙人種桃樹,又摘桃花賣酒錢。 一、MySQL5.7 降序索引 MySQL在語法上很早就已經支持降序索引,但實際上創建的卻仍然是升序索引,如下MySQL 5.7 所示,row2欄位降序,但是從show create table看 row2 ......
uj5u.com 2022-05-09 07:11:36 moreLinux環境下,MySQL的主要目錄及其作用、資料庫和資料表在檔案系統上的存盤結構。 ......
uj5u.com 2022-05-09 07:11:28 moreMysql復習的一個小總結,用xmind寫的。(字數沒有都不給我發博客😹) 下面是一些備注 子查詢 MySQL子查詢稱為內部查詢,而包含子查詢的查詢稱為外部查詢。 子查詢可以在使用運算式的任何地方使用,并且必須在括號中關閉。 視圖 基本語法可以使用 CREATE VIEW 陳述句來創建視圖。 語法格 ......
uj5u.com 2022-05-09 07:10:34 moreMySQL8新增降序索引 桃花塢里桃花庵,桃花庵里桃花仙。桃花仙人種桃樹,又摘桃花賣酒錢。 一、MySQL5.7 降序索引 MySQL在語法上很早就已經支持降序索引,但實際上創建的卻仍然是升序索引,如下MySQL 5.7 所示,row2欄位降序,但是從show create table看 row2 ......
uj5u.com 2022-05-09 07:10:25 moreLinux環境下,MySQL的主要目錄及其作用、資料庫和資料表在檔案系統上的存盤結構。 ......
uj5u.com 2022-05-09 07:10:19 more?大資料概述 在大資料這個概念興起之前,資訊系統存盤資料的方法主要是我們熟知的關系型資料庫,關系型資料庫,關系型模型之父 Edgar F. Codd,在 1970 年 Communications of ACM 上發表了《大型共享資料庫資料的關系模型》的經典論文,從此之后關系模型的語意設計達到了 4 ......
uj5u.com 2022-05-09 07:10:05 more一、下載安裝IDEA IDEA2020.2.3版本:https://www.cnblogs.com/liugp/p/13868346.html 最新版本安裝詳情請參考:https://www.jb51.net/article/196349.htm 二、搭建本地hadoop環境(window10) 可 ......
uj5u.com 2022-05-09 07:09:25 more