Giới thiệu về MYSQL
SQL là chuẩn ngôn ngữ ANSI để truy cập CSDL.
SQL là gì?
* SQL là viết tắt của Structured Query Language - Ngôn ngữ truy vấn cấu trúc.
* SQL cho phép bạn truy cập vào CSDL.
* SQL là một chuẩn ngôn ngữ của ANSI.
* SQL có thể thực thi các câu truy vấn trên CSDL.
* SQL có thể lấy dữ liệu từ CSDL.
* SQL có thể chèn dữ liệu mới vào CSDL.
* SQL có thể xoá dữ liệu trong CSDL.
* SQL có thể sửa đổi dữ liệu hiện có trong CSDL.
* SQL dễ học



SQL là một chuẩn
SQL là một chuẩn của ANSI (American National Standards Institute - Viện tiêu chuẩn quốc gia Hoa kỳ) về truy xuất các hệ thống CSDL. Các câu lệnh SQL được sử dụng để truy xuất và cập nhật dữ liệu trong một CSDL.
SQL hoạt động với hầu hết các chương trình CSDL như MS Access, DB2, Informix, MS SQL Server, Oracle, Sybase v.v...
Lưu ý: Hầu hết các chương trình CSDL hỗ trợ SQL đều có phần mở rộng cho SQL chỉ hoạt động với chính chương trình đó.
Bảng CSDL
Một CSDL thường bao gồm một hoặc nhiều bảng (table). Mỗi bảng được xác định thông qua một tên (ví dụ Customers hoặc Orders). Bảng chứa các mẩu tin - dòng (record - row), là dữ liệu của bảng.
Dưới đây là một ví dụ về một bảng có tên là Persons (người):
LastName FirstName Address City Hansen Ola Timoteivn 10 Sandnes Svendson Tove Borgvn 23 Sandnes Pettersen Kari Storgt 20 Stavanger
Bảng ở trên bao gồm 3 mẩu tin (dòng), mỗi mẩu tin tương ứng với một người, và bốn cột (LastName, FirstName, AddressCity).
Câu truy vấn SQL
Với SQL ta có thể truy vấn CSDL và nhận lấy kết quả trả về thông qua các câu truy vấn.
Một câu truy vấn như sau:
SELECT LastName FROM Persons
Sẽ trả về kết quả như sau:
LastName Hansen Svendson Pettersen
Lưu ý: Một số hệ thống CSDL đòi hỏi câu lệnh SQL phải kết thúc bằng một dấu chấm phảy (;). Chúng ta sẽ không dùng dấu chấm phảy trong bài viết này.
SQL là ngôn ngữ thao tác dữ liệu (DML - Data Manipulation Language)
SQL là cú pháp để thực thi các câu truy vấn. SQL cũng bao gồm cú pháp để cập nhật - sửa đổi, chèn thêm và xoá các mẩu tin.
Sau đây là danh sách các lệnh và truy vấn dạng DML của SQL:
  • SELECT - lấy dữ liệu từ một bảng CSDL.
  • UPDATE - cập nhật/sửa đổi dữ liệu trong bảng.
  • DELETE - xoá dữ liệu trong bảng.
  • INSERT INTO - thêm dữ liệu mới vào bảng.
SQL là ngôn ngữ định nghĩa dữ liệu (DDL - Data Definition Language)
Phần DDL của SQL cho phép tạo ra hoặc xoá các bảng. Chúng ta cũng có thể định nghĩa các khoá (key), chỉ mục (index), chỉ định các liên kết giữa các bảng và thiết lập các quan hệ ràng buộc giữa các bảng trong CSDL.
Các lệnh DDL quan trọng nhất của SQL là:
  • CREATE TABLE - tạo ra một bảng mới.
  • ALTER TABLE - thay đổi cấu trúc của bảng.
  • DROP TABLE - xoá một bảng.
  • CREATE INDEX - tạo chỉ mục (khoá để tìm kiếm - search key).
  • DROP INDEX - xoá chỉ mục đã được tạo.
Mệnh đề WHERE
Mệnh đề WHERE được dùng để thiết lập điều kiện truy xuất.
Mệnh đề WHERE
Để truy xuất dữ liệu trong bảng theo các điều kiện nào đó, một mệnh đề WHERE có thể được thêm vào câu lệnh SELECT.
Cú pháp
Cú pháp mệnh đề WHERE trong câu lệnh SELECT như sau:
SELECT tên_cột FROM tên_bảng
WHERE tên_cột phép_toán giá_trị
Trong mệnh đề WHERE, các phép toán được sử dụng là
Phép toán Mô tả
= So sánh bằng
<> So sánh không bằng
> Lớn hơn
< Nhỏ hơn
>= Lớn hơn hoặc bằng
<= Nhỏ hơn hoặc bằng
BETWEEN Nằm giữa một khoảng
LIKE So sánh mẫu chuỗi
Lưu ý: Trong một số phiên bản của SQL, phép toán <> có thể được viết dưới dạng !=
Sử dụng mệnh đề WHERE
Để lấy danh sách những người sống ở thành phố Sandnes, ta sử dụng mệnh đề WHERE trong câu lệnh SELECT như sau:
SELECT * FROM Persons
WHERE City = 'Sandnes'
Bảng Persons:
LastNameFirstNameAddressCityYearHansenOlaTimoteivn 10Sandnes1951SvendsonToveBorgvn 23Sandnes1978SvendsonStaleKaivn 18Sandnes1980PettersenKariStorgt 20Stavanger1960
Kết quả trả về:
LastNameFirstNameAddressCityYearHansenOlaTimoteivn 10Sandnes1951SvendsonToveBorgvn 23Sandnes1978SvendsonStaleKaivn 18Sandnes1980
Sử dụng dấu nháy
Lưu ý rằng ở ví dụ trên ta đã sử dụng hai dấu nháy đơn (') bao quanh giá trị điều kiện 'Sandnes'.
SQL sử dụng dấu nháy đơn bao quanh các giá trị ở dạng chuỗi văn bản (text). Nhiều hệ CSDL còn cho phép sử dụng dấu nháy kép ("). Các giá trị ở dạng số không dùng dấu nháy để bao quanh.
Với dữ liệu dạng chuỗi văn bản:
Câu lệnh đúng:
SELECT * FROM Persons WHERE FirstName = 'Tove'

Câu lệnh sai:
SELECT * FROM Persons WHERE FirstName = Tove
Với dữ liệu dạng số:
Câu lệnh đúng:
SELECT * FROM Persons WHERE Year > 1965

Câu lệnh sai:
SELECT * FROM Persons WHERE Year > '1965'
Phép toán điều kiện LIKE
Phép toán LIKE được dùng để tìm kiếm một chuỗi mẫu văn bản trên một cột.
Cú pháp
Cú pháp của phép toán LIKE như sau:
SELECT tên_cột FROM tên_bảng
WHERE tên_cột LIKE mẫu
Một ký hiệu % có thể được sử dụng để định nghĩa các ký tự đại diện. % có thể được đặt trước và/hoặc sau mẫu.
Sử dụng LIKE
Câu lệnh SQL sau sẽ trả về danh sách những người có tên bắt đầu bằng chữ O:
SELECT * FROM Persons
WHERE FirstName LIKE 'O%'
Câu lệnh SQL sau sẽ trả về danh sách những người có tên kết thúc bằng chữ a:
SELECT * FROM Persons
WHERE FirstName LIKE '%a'
Câu lệnh SQL sau sẽ trả về danh sách những người có tên kết chứa chuỗi la:SELECT * FROM Persons
WHERE FirstName LIKE '%la%'

Toán tử lô-gic AND và OR
AND và OR
Hai toán tử AND và OR nối hai hoặc nhiều điều kiện trong mệnh đề WHERE lại với nhau.
Toán tử AND sẽ hiển thị 1 dòng nếu TẤT CẢ các điều kiện đều thoả mãn. Toán tử OR hiển thị một dòng nếu BẤT KỲ điều kiện nào được thoả.
Bảng dữ liệu dùng trong ví dụ
LastNameFirstNameAddressCityHansenOlaTimoteivn 10SandnesSvendsonToveBorgvn 23SandnesSvendsonStephenKaivn 18Sandnes
Ví dụ 1
Sử dụng AND để tìm những người có tên là Tove và họ là Svendson:
SELECT * FROM PersonsWHERE FirstName = 'Tove'AND LastName = 'Svendson'
Kết quả trả về:
LastNameFirstNameAddressCitySvendsonToveBorgvn 23Sandnes
Ví dụ 2
Sử dụng OR để tìm những người có tên là Tove hoặc họ là Svendson:
SELECT * FROM PersonsWHERE firstname = 'Tove'OR lastname = 'Svendson'
Kết quả trả về:
LastNameFirstNameAddressCitySvendsonToveBorgvn 23SandnesSvendsonStephenKaivn 18Sandnes
Ví dụ 3
Bạn cũng có thể sử dụng kết hợp AND và OR cùng với dấu ngoặc đơn để tạo nên các câu truy vấn phức tạp:
SELECT * FROM Persons WHERE(FirstName = 'Tove' OR FirstName = 'Stephen')AND LastName = 'Svendson'
Kết quả trả về:
LastNameFirstNameAddressCitySvendsonToveBorgvn 23SandnesSvendsonStephenKaivn 18Sandnes

Toán tử BETWEEN...AND
Toán tử BETWEEN...AND lấy ra một miền dữ liệu nằm giữa hai giá trị. Hai giá trị này có thể là số, chuỗi văn bản hoặc ngày tháng.
SELECT tên_cột FROM tên_bảng
WHERE tên_cột
BETWEEN giá_trị_1 AND giá_trị_2
Bảng dữ liệu dùng trong ví dụ
LastNameFirstNameAddressCityHansenOlaTimoteivn 10SandnesNordmannAnnaNeset 18SandnesPettersenKariStorgt 20StavangerSvendsonToveBorgvn 23Sandnes
Ví dụ 1
Tìm tất cả những người có họ (sắp xếp theo ABC) nằm giữa Hansen (tính luôn Hansen) và Pettersen (không tính Pettersen):
SELECT * FROM Persons WHERE LastName
BETWEEN 'Hansen' AND 'Pettersen'
Kết quả trả về:
LastNameFirstNameAddressCityHansenOlaTimoteivn 10SandnesNordmannAnnaNeset 18Sandnes
Lưu ý quan trọng: Toán tử BETWEEN...END sẽ trả về những kết quả khác nhau trên các hệ CSDL khác nhau. Với một số hệ CSDL, toán tử BETWEEN...END sẽ trả về các dòng mà có giá trị thực sự "nằm giữa" hai khoảng giá trị (tức là bỏ qua không tính đến các giá trị trùng với giá trị của hai đầu mút). Một số hệ CSDL thì sẽ tính luôn các giá trị trùng với hai đầu mút. Trong khi đó một số hệ CSDL khác lại chỉ tính các giá trị trùng với đầu mút thứ nhất mà không tính đầu mút thứ hai (như ở ví dụ phía trên). Do vậy, bạn phải kiểm tra lại hệ CSDL mà bạn đang dùng khi sử dụng toán tử BETWEEN...AND.
Ví dụ 2
Để tìm những người có họ (sắp xếp theo ABC) nằm ngoài khoảng hai giá trị ở ví dụ 1, ta dùng thêm toán tử NOT:
SELECT * FROM Persons WHERE LastName
NOT BETWEEN 'Hansen' AND 'Pettersen'
Kết quả trả về:
LastNameFirstNameAddressCityPettersenKariStorgt 20StavangerSvendsonToveBorgvn 23Sandnes

Câu lệnh INSERT INTO.
Câu lệnh INSERT INTO
Câu lệnh INSERT INTO được dùng để chèn dòng mới vào bảng.

Cú pháp:
INSERT INTO tên_bảng
VALUES (giá_trị_1, giá_trị_2,....)
Bạn cũng có thể chỉ rõ các cột/trường nào cần chèn dữ liệu:
INSERT INTO tên_bảng (cột_1, cột_2,...)
VALUES (giá_trị_1, giá_trị_2,....)
Chèn 1 dòng mới
Ta có bảng Persons như sau:
LastNameFirstNameAddressCityPettersenKariStorgt 20Stavanger

Câu lệnh SQL sau:
INSERT INTO Persons
VALUES ('Hetland', 'Camilla', 'Hagabakka 24', 'Sandnes')
sẽ tạora kết quả trong bảng Persons như sau:
LastNameFirstNameAddressCityPettersenKariStorgt 20StavangerHetlandCamillaHagabakka 24Stavanger
Chèn dữ liệu vào các cột/trường cụ thể

Với bảng Persons như trên, câu lệnh SQL sau:
INSERT INTO Persons (LastName, Address)
VALUES ('Rasmussen', 'Storgt 67')
Sẽ tạo ra kết quả:
LastNameFirstNameAddressCityPettersenKariStorgt 20StavangerHetlandCamillaHagabakka 24StavangerRasmussenStorgt 67

Câu lệnh UPDATE
Câu lệnh UPDATE
Câu lệnh UPDATE được sử dụng để cập nhật/sửa đổi dữ liệu đã có trong bảng.

Cú pháp:
UPDATE tên_bảng
SET tên_cột = giá_trị_mới
WHERE tên_cột = giá_trị
Ví dụ: bảng Person của ta như sau:
LastNameFirstNameAddressCityNilsenFredKirkegt 56StavangerRasmussenStorgt 67
Cập nhật 1 cột trên 1 dòng

Giả sử ta muốn bổ xung thêm phần tên cho người có họ là Rasmussen:
UPDATE Person SET FirstName = 'Nina'
WHERE LastName = 'Rasmussen'
Ta sẽ có kết quả như sau:
LastNameFirstNameAddressCityNilsenFredKirkegt 56StavangerRasmussenNinaStorgt 67
Cập nhật nhiều cột trên 1 dòng

Bây giờ ta lại muốn đổi tên và địa chỉ:
UPDATE Person
SET Address = 'Stien 12', City = 'Stavanger'
WHERE LastName = 'Rasmussen'
Kết quả sẽ là:
LastNameFirstNameAddressCityNilsenFredKirkegt 56StavangerRasmussenNinaStien 12Stavanger


Câu lệnh DELETE
Câu lệnh DELETE được dùng để xoá các dòng ra khỏi bảng.
Cú pháp:
DELETE FROM tên_bảng
WHERE tên_cột = giá_trị
Ví dụ: Bảng Person của ta như sau:
LastNameFirstNameAddressCityNilsenFredKirkegt 56StavangerRasmussenNinaStien 12Stavanger
Xoá 1 dòng:
Ta xoá người có tên là Nina Rasmussen:
DELETE FROM Person WHERE LastName = 'Rasmussen'
Kết quả sau khi xoá:
LastNameFirstNameAddressCityNilsenFredKirkegt 56Stavanger
Xoá tất cả các dòng:
Đôi khi ta muốn xoá tất cả dữ liệu trong bảng nhưng vẫn giữ lại bảng cùng với cấu trúc và tất cả các thuộc tính của bảng, ta có thể dùng câu lệnh:
DELETE FROM table_name
hoặcDELETE * FROM table_name

Hàm COUNT
SQL có sẵn lệnh để đếm các dòng trong CSDL.
Cú pháp của hàm COUNT:
SELECT COUNT(tên_cột) FROM tên_bảng
Hàm COUNT:
Hàm COUNT trả về số lượng các dòng được chọn ở trong bảng.
Ví dụ ta có bảng Persons như sau:
NameAgeHansen, Ola34Svendson, Tove45Pettersen, Kari19
Câu lệnh sau sẽ trả về số lượng các dòng trong bảng:
SELECT COUNT(*) FROM Persons
và kết quả trả về sẽ là:
3
Câu lệnh sau sẽ trả về số lượng những người lớn hơn 20 tuổi:
SELECT COUNT(*) FROM Persons WHERE Age > 20
kết quả trả về sẽ là:
2
Hàm COUNT(column):
Hàm COUNT(column) sẽ trả về số lượng các dòng có giá trị khác NULL ở cột được chỉ định.
Ví dụ ta có bảng Persons như sau:
NameAgeHansen, Ola34Svendson, Tove45Pettersen, Kari
Câu lệnh sau sẽ trả về số lượng những người mà cột Age trong bảng không rỗng:
SELECT COUNT(Age) FROM Persons
và kết quả trả về sẽ là:
2
Mệnh đề COUNT DISTINCT
Lưu ý: Các ví dụ dưới đây chỉ hoạt động với CSDL OracleMS SQL Server, không hoạt động trên MS Access (chưa thử nhiệm với các hệ CSDL khác!)
Từ khoá DISTINCT và COUNT có thể được dùng chung với nhau để đếm số lượng các kết quả không trùng nhau.
Cú pháp như sau:
SELECT COUNT(DISTINCT column(s)) FROM table
Ví dụ ta có bảng Orders như sau:
CompanyOrderNumberSega3412W3Schools2312Trio4678W3Schools6798
Câu lệnh SQL sau:
SELECT COUNT(DISTINCT Company) FROM Orders
sẽ trả về kết quả là:3

Phần Nâng cao-Hàm
SQL có sẵn khá nhiều hàm để thực hiện đếm và tính toán.
Cú pháp:
Cú pháp để gọi hàm trong câu lệnh SQL như sau:
SELECT function(tên_cột) FROM tên_bảng
Bảng dữ liệu chúng ta sẽ dùng trong các ví sụ tiếp theo:
NameAgeHansen, Ola34Svendson, Tove45Pettersen, Kari19
Hàm AVG(column)
Hàm AVG trả về giá trị trung bình tính theo cột được chỉ định của các dòng được chọn. Các giá trị NULL sẽ không được xét đến khi tính giá trị trung bình.
Ví dụ:
Câu lệnh sau sẽ tính số tuổi trung bình của những người có tuổi trên 20:
SELECT AVG(Age) FROM Persons WHERE Age > 20
kết quả trả về sẽ là:
39.5
Hàm MAX(column)
Hàm MAX trả về giá trị lớn nhất trong cột. Các giá trị NULL sẽ không được xét đến.
Ví dụ:
SELECT MAX(Age) FROM Persons
kết quả trả về:
45
Hàm MIN(column)
Hàm MAX trả về giá trị nhỏ nhất trong cột. Các giá trị NULL sẽ không được xét đến.
Ví dụ:
SELECT MIN(Age) FROM Persons
kết quả trả về:
19
Lưu ý: Hàm MIN và MAX cũng có thể áp dụng cho các cột có dữ liệu là chuỗi văn bản. Dữ liệu trong cột sẽ được so sánh theo thứ tự tăng dần của từ điển
Hàm SUM(column)
Hàm SUM trả về tổng giá trị của cột. Các giá trị NULL sẽ không được xét đến.
Ví dụ:
Tìm tổng số tuổi của tất cả những người có trong bảng:
SELECT SUM(Age) FROM Persons
kết quả trả về:
98
Ví dụ:
Tìm tổng số tuổi của tất cả những người có tuổi lớn hơn 20:
SELECT SUM(Age) FROM Persons WHERE Age > 20
kết quả trả về:79


Tạo CSDL và bảng với CREATE
Tạo một CSDL
CREATE DATABASE tên_CSDL
Tạo một bảng trong một CSDL
CREATE TABLE tên_bảng
(
tên_cột_1 kiểu_dữ_liệu,
tên_cột_2 kiểu_dữ_liệu,
.......
)
Ví dụ
Tạo một bảng tên Person có bốn cột: LastName, FirstName, AddressAge:
CREATE TABLE Person
(
LastName varchar,
FirstName varchar,
Address varchar,
Age int
)
Tạo bảng và đặt kích thước tối đa của các cột:
CREATE TABLE Person
(
LastName varchar(30),
FirstName varchar,
Address varchar,
Age int(3)
)
Kiểu dữ liệu sẽ qui định loại dữ liệu nào được phép lưu trữ trong cột. Sau đây là các kiểu dữ liệu thường dùng nhất trong SQL:
integer(n)
int(n)
smallint(n)
tinyint(n)
Chỉ lưu trữ dữ liệu là số nguyên. Số lượng tối đa các chữ số được qui định bởi n.decimal(n,d)
numeric(n,d)
Lưu trữ số thập nhân. Số lượng tối đa các chữ số được qui định bởi n. Số lượng tối đa các chữ số sau dấu phảy thập phân được qui định bởi d.char(n)Lưu trữ n ký tự.varchar(n)Lưu trữ tối đa n ký tự.date(yyyymmdd)Lưu trữ ngày tháng (dạng năm-tháng-ngày)
Tạo chỉ mục
Chỉ mục được tạo ra nhằm để các dòng trong bảng được truy xuất nhanh và hiệu quả hơn. Chỉ mục có thể được tạo trên một hoặc nhiều cột của bảng, và mỗi chỉ mục được đặt một tên. Người dùng không thấy được các chỉ mục này, chúng chỉ được dùng để tăng tốc cho CSDL.
Lưu ý: Sau khi bảng đã được tạo chỉ mục thì việc cập nhật thay thêm dòng mới vào bảng sẽ mất nhiều thời gian hơn là đối với bảng không có chỉ mục. Lý do là vì khi cập nhật bảng, các chỉ mục đồng thời cũng phải được cập nhật theo. Vì thế, ta chỉ nên tạo chỉ mục cho các cột thường xuyên dùng trong các tác vụ tìm kiếm.
Chỉ mục đơn nhất (Unique Index)
Chỉ mục đơn nhất sẽ bắt buộc hai dòng bất kỳ của bảng sẽ không được phép mang cùng giá trị ở cột được tạo chỉ mục.
Cú pháp:
CREATE UNIQUE INDEX tên_chỉ_mục
ON tên_bảng (tên_cột)
Chỉ mục đơn (Simple Index)
Khi không dùng từ khoá UNIQUE trong câu lệnh tạo chỉ mục, các giá trị trùng nhau trong cột sẽ được phép.
Cú pháp:
CREATE INDEX tên_chỉ_mục
ON tên_bảng (tên_cột)
Ví dụ
Tạo một chỉ mục đơn có tên là PersonIndex trên cột LastName của bảng Person:
CREATE INDEX PersonIndex
ON Person (LastName)
Nếu bạn muốn tạo chỉ mục sắp xếp giảm dần, bạn sử dụng thêm từ dành riêng DESC:
CREATE INDEX PersonIndex
ON Person (LastName DESC)
Nếu bạn muốn tạo chỉ mục trên nhiều cột:
CREATE INDEX PersonIndex
ON Person (LastName, Firstname)
Xoá chỉ mục
Bạn có thể xoá chỉ mục đã tạo bằng lệnh DROP.
DROP INDEX tên_bảng.tên_chỉ_mục
Xoá CSDL hoặc bảng
Để xoá một CSDL (các bảng trong CSDL cũng đồng thời được xoá):
DROP DATABASE tên_CSDL
Để xoá một bảng (toàn bộ cấu trúc, dữ liệu và chỉ mục của bảng sẽ được xoá):DROP TABLE tên_bảng

Câu lệnh ALTER
Thay đổi cấu trúc bảng.
Câu lệnh ALTER TABLE được sử dụng để thêm hoặc xoá cột trong một bảng.
ALTER TABLE tên_bảng
ADD tên_cột kiểu_dữ_liệu

ALTER TABLE tên_bảng
DROP COLUMN tên_cột
Lưu ý: Một số hệ CSDL không cho phép việc xoá bỏ cột trong bảng.
Ví dụ: ta có bảng Person như sau:
LastNameFirstNameAddressPettersenKariStorgt 20
Thêm một cột tên là City vào bảng Person:
ALTER TABLE Person ADD City varchar(30)
kết quả:
LastNameFirstNameAddressCityPettersenKariStorgt 20
Xoá cột Address:
ALTER TABLE Person DROP COLUMN Address
kết quả:
LastNameFirstNameCityPettersenKari