对象存储

产品文档

对象存储

OSS Select(公测)

OSS Select用于对文件执行SQL语句,返回执行结果。

使用场景

在使用OSS进行数据处理的场景下,需要将数据仓库的海量数据文件存放在OSS。如果大数据平台使用OSS的Get Object接口,只能把文件全部下载到本地才能进行分析过滤,浪费了大量带宽和客户端资源。 OSS Select可以让OSS对数据做一定的分析处理,接口直接返回处理后的结果,既减少了客户端的网络带宽,又减少了客户端的数据处理量,节省了客户端的CPU、内存等计算资源。

规则限制

  • 使用者需要拥有GetObject权限。

  • SQL语句的最大长度为256KB。

  • 输入或结果中记录的最大长度为1MB。

OSS Select支持的文件格式:

  • 支持UTF-8编码的CSV文件。

支持的SQL语法:

  • SQL子句:SELECT,FROM,WHERE,LIMIT

  • 数据类型:string,int(64bit),bool,float,decimal,numeric

  • 函数:MAX,MIN,SUM,AVG,LOWER,UPPER,TRIM,CAST,COUNT

  • MAX,MIN,SUM,AVG函数需要嵌套CAST函数使用,CAST不支持decimal,numeric数据类型

  • 操作:逻辑运算符(AND,NOT,OR)、比较运算符(<,>,<=,>=,=,<>,BETWEEN,IN)、模式匹配运算符(LIKE)、数学运算符(+,-,*)

使用方法

通过Select Content Object接口调用

SQL示例

含义 SQL语句
返回前6行数据 select * from csvobject limit 10

保留关键字

序号 字段 序号 字段 序号 字段 序号 字段 序号 字段
1 absolute 51 create 101 goto 151 octet_length 201 struct
2 action 52 cross 102 grant 152 of 202 substring
3 add 53 current 103 group 153 on 203 sum
4 all 54 current_date 104 having 154 only 204 symbol
5 allocate 55 current_time 105 hour 155 open 205 system_user
6 alter 56 current_timestamp 106 identity 156 option 206 table
7 and 57 current_user 107 immediate 157 or 207 temporary
8 any 58 cursor 108 in 158 order 208 then
9 are 59 date 109 indicator 159 outer 209 time
10 as 60 day 110 initially 160 output 210 timestamp
11 asc 61 deallocate 111 inner 161 overlaps 211 timezone_hour
12 assertion 62 dec 112 input 162 pad 212 timezone_minute
13 at 63 decimal 113 insensitive 163 partial 213 to
14 authorization 64 declare 114 insert 164 pivot 214 trailing
15 avg 65 default 115 int 165 position 215 transaction
16 bag 66 deferrable 116 integer 166 precision 216 translate
17 begin 67 deferred 117 intersect 167 prepare 217 translation
18 between 68 delete 118 interval 168 preserve 218 trim
19 bit 69 desc 119 into 169 primary 219 true
20 bit_length 70 describe 120 is 170 prior 220 tuple
21 blob 71 descriptor 121 isolation 171 privileges 221 union
22 bool 72 diagnostics 122 join 172 procedure 222 unique
23 boolean 73 disconnect 123 key 173 public 223 unknown
24 both 74 distinct 124 language 174 read 224 unpivot
25 by 75 domain 125 last 175 real 225 update
26 cascade 76 double 126 leading 176 references 226 upper
27 cascaded 77 drop 127 left 177 relative 227 usage
28 case 78 else 128 level 178 restrict 228 user
29 cast 79 end 129 like 179 revoke 229 using
30 catalog 80 end-exec 130 limit 180 right 230 value
31 char 81 escape 131 list 181 rollback 231 values
32 char_length 82 except 132 local 182 rows 232 varchar
33 character 83 exception 133 lower 183 schema 233 varying
34 character_length 84 exec 134 match 184 scroll 234 view
35 check 85 execute 135 max 185 second 235 when
36 clob 86 exists 136 min 186 section 236 whenever
37 close 87 external 137 minute 187 select 237 where
38 coalesce 88 extract 138 missing 188 session 238 with
39 collate 89 false 139 module 189 session_user 239 work
40 collation 90 fetch 140 month 190 set 240 write
41 column 91 first 141 names 191 sexp 241 year
42 commit 92 float 142 national 192 size 242 zone
43 connect 93 for 143 natural 193 smallint - -
44 connection 94 foreign 144 nchar 194 some - -
45 constraint 95 found 145 next 195 space - -
46 constraints 96 from 146 no 196 sql - -
47 continue 97 full 147 not 197 sqlcode - -
48 convert 98 get 148 null 198 sqlerror - -
49 corresponding 99 global 149 nullif 199 sqlstate - -
50 count 100 go 150 numeric 200 string - -
更新时间:2020-07-23 09:38:17