博客專欄

EEPW首頁 > 博客 > 數(shù)據(jù)科學(xué)面試中應(yīng)該知道的5個(gè)SQL日期函數(shù)

數(shù)據(jù)科學(xué)面試中應(yīng)該知道的5個(gè)SQL日期函數(shù)

發(fā)布人:數(shù)據(jù)派THU 時(shí)間:2021-09-19 來源:工程師 發(fā)布文章

來源:DeepHub IMBA

一個(gè)優(yōu)秀的 SQL 開發(fā)人員是能夠以他們喜歡的任何方式操作數(shù)據(jù)的——其中很大一部分是能夠操作日期。因?yàn)槿掌诜浅V匾?,比如企業(yè)喜歡比較和評估不同時(shí)間段的業(yè)務(wù)績效,統(tǒng)計(jì)一個(gè)時(shí)段的指標(biāo),這些都離不開日期函數(shù),能夠操縱日期對于頂級業(yè)務(wù)運(yùn)營和業(yè)務(wù)報(bào)告至關(guān)重要。

在本文中,我們將深入探討 SQL 中 5 個(gè)最重要和最有用的 DATE 函數(shù)以及一些可以使用它們的實(shí)際業(yè)務(wù)案例。

DATE_TRUNC()

 DATE_TRUNC(date_expression, date_part)

DATE_TRUNC() 將日期縮短為指定的日期部分。

在下面的示例中,由于我們指定了 date_part = MONTH,因此 date_trunc() 將截?cái)嗳掌谝垣@取該月的第一天:

 DATE_TRUNC('2021-06-28', MONTH) = '2021-06-01'
 DATE_TRUNC('2021-06-28', YEAR) = '2021-01-01'

如果我們指定 date_part = YEAR,那么我們將得到指定日期的年份的第一天:

什么時(shí)候使用?

DATE_TRUNC 在你希望定期(例如每周、每月或每年)匯總數(shù)字時(shí)非常有用。

DATE_TRUNC 在進(jìn)行分組分析時(shí)是必要的,你通常按月對用戶進(jìn)行分組。

示例 :假設(shè)你想從下表中獲得每周的銷售額總和:

1.png

 with sales_data as (
    SELECT DATE_TRUNC(date, WEEK) as week_date,
            daily_sales
    FROM sales
 )
 SELECT week_date,
        SUM(daily_sales) as weekly_sales
 FROM sales_data
 GROUP BY week_date

DATE_DIFF()

 DATE_DIFF(date_expression_1, date_expression_2, date_part)

DATE_DIFF() 比較兩個(gè)日期并返回兩個(gè)日期之間日期部分的差異。

例如,如果 date_part = DAY,則 DATE_DIFF() 返回兩個(gè)日期之間的天數(shù)。如果 date_part = MONTH,則 DATE_DIFF() 返回兩個(gè)日期之間的 MONTH 數(shù)。

 DATE_DIFF('2021-01-02', '2021-01-01', DAY) = 1

什么時(shí)候使用?

DATE_DIFF() 在你想要比較兩個(gè)日期時(shí)很有用,例如,包裹何時(shí)發(fā)貨和包裹何時(shí)交付,或者用戶何時(shí)注冊和何時(shí)取消。

DATE_DIFF() 在 WHERE 子句中也很有用,如果你想過濾 X 周期前發(fā)生的日期(例如 5 天前、2 周前、上個(gè)月)。

示例1 :假設(shè)你想獲取包裹發(fā)貨時(shí)間和包裹送達(dá)時(shí)間之間的時(shí)間:

2.png

 SELECT order_id
      , DATE_DIFF(date_received, date_shipped, DAY) as shipping_time
 FROM orders

示例 2:使用上表,假設(shè)你想獲取所有發(fā)貨時(shí)間少于 10 天的訂單:

 SELECT order_id
      , amount
 FROM orders
 WHERE DATE_DIFF(date_received, date_shipped, DAY) < 10

DATE_ADD() / DATE_SUB()

 DATE_ADD(date_expression, INTERVAL int64 date_part)
 DATE_SUB(date_expression, INTERVAL int64 date_part)

DATE_ADD() 將指定數(shù)量添加到日期部分。相反,DATE_SUB 將日期指定減去數(shù)量。

DATE_ADD('2021-01-01', INTERVAL 3 DAY) = '2021-01-04'
 DATE_SUB('2021-01-04', INTERVAL 3 DAY) = '2021-01-01'
 DATE_ADD('2021-01-01', INTERVAL 1 MONTH) = '2021-02-01'

什么時(shí)候使用?

DATE_ADD() 和 DATE_SUB() 可以像 WHERE 子句中的 DATE_DIFF() 一樣使用,以過濾 X 周期前或?qū)?X 周期發(fā)生的日期。

示例 1:假設(shè)你想獲取所有發(fā)貨時(shí)間少于 10 天的訂單:

3.jpg

 SELECT order_id
      , amount
 FROM orders
 WHERE DATE_ADD(date_shipped, INTERVAL 10 DAY) > date_received

EXTRACT()

 EXTRACT(part FROM date_expression)

EXTRACT() 返回與指定日期部分對應(yīng)的值。

 EXTRACT(DAY FROM '2021-01-03') = 3
 EXTRACT(MONTH FROM '2021-01-03') = 1
 EXTRACT(YEAR FROM '2021-01-03') = 2021

什么時(shí)候使用?

使用 EXTRACT() 是獲取日期的特定部份的一種簡單方法。

例如需要按周數(shù)報(bào)告,可以使用 EXTRACT() 獲取給定記錄的給定日期的周數(shù)。

EXTRACT() 允許你從日期中獲取月份數(shù)或年份,可用作機(jī)器學(xué)習(xí)模型的特征。

CURRENT_DATE()

 CURRENT_DATE([time_zone])

CURRENT_DATE() 返回在指定時(shí)區(qū)執(zhí)行查詢的當(dāng)前日期。注意時(shí)區(qū)參數(shù)是可選的,不需要指定。

什么時(shí)候使用?

使用 CURRENT_DATE() 是引用今天日期的一種更簡單的方法,而不是硬編碼的日期,如果它是在 Airflow 上固化的查詢或你經(jīng)常使用的查詢,這尤其有用。

示例 1:假設(shè)你想獲取過去一周內(nèi)發(fā)貨的所有訂單:

4.jpg

 SELECT order_id
      , amount
 FROM orders
 WHERE DATE_DIFF(CURRENT_DATE(), date_shipped, DAY) < 7

示例 2:假設(shè)你想獲取與今天日期同月發(fā)貨的任何年份的所有訂單:

 

SELECT order_id
      , amount
 FROM orders
 WHERE EXTRACT(MONTH FROM date_shipped) = EXTRACT(MONTH FROM CURRENT_DATE())

編輯:于騰凱

校對:汪雨晴

*博客內(nèi)容為網(wǎng)友個(gè)人發(fā)布,僅代表博主個(gè)人觀點(diǎn),如有侵權(quán)請聯(lián)系工作人員刪除。



關(guān)鍵詞: AI

相關(guān)推薦

技術(shù)專區(qū)

關(guān)閉