独角兽企业重金招聘Python工程师标准>>>
利用一条SQL语句从数据库Table表中随机获取N条记录,各数据库的SQL语句略有不同,如下:
1、MySql
Select*
From
TABLE
Order
By
Rand() Limit N
以上代码效率不高,自己对1000条数据表随机取10条的测试结果为耗时0.125s,有网友推荐改为以下代码效率有大幅提高,耗时为0.005s,不过结果是随机从某个位置开始取N条记录,而不是随机取N条记录,略有差异。详细说明见mysql使用rand随机查询记录效率测试。
SELECT
*
FROM
`
TABLE
` a
join
(
SELECT
ROUND(RAND() * ((
SELECT
MAX
(id)
FROM
`
TABLE
`)-(
SELECT
MIN
(id)
FROM
`
TABLE
`))+(
SELECT
MIN
(id)
FROM
`
TABLE
`))
AS
id)
AS
b
WHERE
a.id >= b.id
ORDER
BY
a.id LIMIT N;
2、SQL Server
SelectTOP
N *
From
TABLE
Order
By
NewID()
NewID()函数将创建一个 uniqueidentifier 类型的唯一值。
3、Access
SelectTOP
N *
From
TABLE
Order
By
Rnd(ID)
Rnd(ID) 其中的ID是自动编号字段,可以利用其他任何数值来完成,比如用姓名字段(UserName)
SelectTOP
N *
From
TABLE
Order
BY
Rnd(Len(UserName))
4、Oracle
1)dbms_random包
select*
from
(
select
*
from
Table
order
by
dbms_random.value)
where
rownum < N;
注:dbms_random包需要手工安装,位于$ORACLE_HOME/rdbms/admin/dbmsrand.sql
dbms_random.value(100,200)
可以产生100到200范围的随机数
2)按概率抽取:
select*
from
Table
sample(百分比);
例:
select*
from
Table
sample(10);
取表Table中记录条数的10%条记录
3)sys_guid
select*
from
(
select
*
from
Table
orderby sys_guid())
where
rownum<N;
5、postgreSQL
select*
from
Table
order
by
random() limit N