Tầm quan trọng của cơ sở dữ liệu?
Các bạn có lẽ đều biết sự khác biệt giữa hai khái niệm dữ liệu ("data") và thông tin ("information"). Nói một cách ngắn gọn thì thông tin là "sản phẩm" có thể rút ra từ dữ liệu và bản thân dữ liệu nếu không qua xử lý sẽ không có ý nghĩa gì cả. Các hệ thống cơ sở dữ liệu ra đời với mục đích lưu trữ dữ liệu và giúp cho quá trình chuyển hóa từ dữ liệu thành thông tin dễ dàng và nhanh chóng hơn gọi là phần mềm quản lý cơ sở dữ liệu và thường thì những phần mềm này cho phép người dùng lấy thông tin thông qua ngôn ngữ truy vấn có cấu trúc (chắc bạn cũng đã nghe về SQL - Structured Query Language)
Nhưng giả sử tự đặt mình vào vị trí giáo viên, khi giảng về cơ sở dữ liệu, làm sao bạn có thể minh họa được tầm quan trọng của các phần mềm quản lý hệ thống cơ sở dữ liệu?
Ông thầy dạy khóa học về cơ sở dữ liệu của tớ bên này đã nghĩ ra một cách khá đơn giản: hãy cho bạn thử làm tay chuyển dữ liệu thành thông tin mà không được sử dụng phầm mềm quản lý cơ sở dữ liệu nào cả. Bạn nhận về cơ sở dữ liệu là một file chứa thông tin về các bộ phim (như tiêu đề, đạo diễn, đánh giá, …) của hơn 80 bộ phim (in ra tổng cộng 13 trang đầy chữ). Nhiệm vụ của bạn là tìm bằng tay một số thông tin và ghi lại thời gian bạn tốn để tìm được những thông tin như vậy. Một vài ví dụ:
1. Liệt kê tựa đề của tất cả các phim của Canada
2. Liệt kê tất cả các phim được đánh giá "18" ở Đức hoặc "R" ở Mỹ mà không phải là phim thuộc thể loại kinh dị (horror)
3. Liệt kê 5 thể loại phổ biến nhất trong số tất cả các bộ phim có hơn 100 người đánh giá.
Nếu tò mò, bạn có thể tham khảo xem một bài tập trong phần cơ sở dữ liệu của tớ như thế nào tại đây.
Những bạn đã từng học qua SQL nhìn mấy câu hỏi trên có thể đọc ra ngay được các câu SQL đơn giản để truy vấn dữ liệu. Nhưng nhớ rằng đề bài không cho phép bạn sử dụng phần mềm quản lý cơ sỡ dữ liệu! Bạn phải ngồi lọc ra từ hơn 13 trang dữ liệu!
Mất gần 3 tiếng đồng hồ chỉ để ngồi lọc thông tin (2 người hợp sức) mới thật sự thấm thía điều mà lâu nay mình vẫn biết (dù vậy, nói thật là vừa ngồi làm tớ vừa căm ghét ông thầy).
Cách xắp xếp tài liệu của Noguchi
Cũng về chủ đề về cách sắp xếp dữ liệu để có thể tìm thông tin dễ dàng, hôm qua mới đọc bài về hệ thống lưu trữ tài liệu của Noguchi Yukio được nói đến trên nhiều blog mấy ngày gần đây. Mỗi ngày văn phòng của bạn tạo ra và nhận được hàng đống tài liệu, giấy tờ (ở đây không áp dụng với trường hợp bạn lưu trữ tất cả tài liệu của bạn trong máy tính - điều mà chưa ai làm được). Theo cách thông thường, bạn có thể sẽ phân loại tài liệu theo thể loại hoặc mức độ quan trọng và cất đi sau khi dùng. Noguchi đưa ra một cấu trúc sắp xếp tài liệu hoàn toàn khác: sắp xếp tài liệu theo tần suất sử dụng. Làm thế nào? Nếu là file trong máy tính thì có lẽ cũng không khó để xắp xếp, nhưng làm sao để xắp xếp giấy tờ ở ngoài? (chẳng lẽ mỗi lần dùng bạn đếm xem đã dùng nó bao nhiêu lần rồi sắp xếp lại?)
Cách do Noguchi đề nghị là như thế này:
1) Với mỗi tài liệu, bạn bỏ nó vào một phong bì, bên ngoài ghi tiêu đề tài liệu và ngày bạn có nó. Bạn có thể sử dụng mã màu cho các phong bì nhưng hoàn toàn không bắt buộc (bởi cách sắp xếp này hoạt động hoàn toàn không cần bất kỳ sự phân loại nào).
2) Bạn sẽ xếp các phong bì này vào một ngăn tủ như sau: Mỗi khi có tài liệu mới, bạn để nó về phía bên trái cùng của ngăn. Tài liệu rút ra từ ngăn sau khi dùng xong cũng sẽ bỏ lại vào ngăn từ phía bên trái cùng như những tài liệu mới.

Dễ dàng thấy rằng với cách sắp xếp này, những tài liệu nào bạn hay dùng nhất sẽ luôn ở phía bên trái và những tài liệu cũ ít khi đụng đến sẽ chuyển dần sang bên phải. Phương pháp lưu trữ tài liệu của Noguchi là dựa vào quan sát của ông rằng người ta thường dễ nhớ về khoảng thời gian cuối cùng mình sử dụng một tài liệu nào đó hơn là mình đã xếp nó ở đâu (nếu phân chia tài liệu theo phân mục như cách thông thường). Một lợi thế quan trọng nhất của phương pháp này là bạn không cần phải thực hiện bất cứ thao tác phân loại nào khi lưu trữ tài liệu. Tất cả các tài liệu đều được xem như nhau và việc cất tài liệu chỉ đơn giản là đưa nó vào đầu hàng bên trái.
Một trong những khó khăn của cách xếp tài liệu theo phân mục chính là ở chỗ chọn phân mục cho tài liệu đó. Khi có một tài liệu mới, bạn đôi khi không biết nên xếp nó vào phân mục nào. Cũng chính vì lý do này nên sau này khi cần tìm tài liệu nào đó có khả năng thuộc vào nhiều loại phân mục khác nhau, bạn đôi khi không thể nhớ chính xác mình đã xếp nó vào phân mục nào.
Cách xắp xếp của Noguchi đồng thời cũng giúp việc cất trữ tài liệu dễ dàng hơn. Như đã giải thích, các tài liệu nằm bên phải cùng sẽ luôn luôn là những tài liệu cũ ít dùng nhất (là những tài liệu mà lần cuối bạn sử dụng nó là xa nhất). Bạn hoàn toàn có thể quyết định đóng hộp một số lượng nào đó những tài liệu nằm bên phải cùng một khi ngăn đã đầy.
Điểm không hay duy nhất của phương pháp này theo tớ là nó quá tốn … phong bì (mỗi tài liệu phải được bỏ vào một phong bì riêng) và với những người không có quá nhiều giấy tờ hoặc hầu hết tài liệu đều được lưu trong máy tính thi nó thậm chí có vẻ hơi "cầu kì" và không cần thiết (máy tính với Google Desktop cho phép bạn tìm kiếm nội dung tài liệu trong thời gian thực :) ). Tuy nhiên, đối với những người làm văn phòng nơi mỗi ngày nhận/truy cập nhiều tài liệu khác nhau thì đây quả là một giải pháp tuyệt vời và đỡ tốn thời gian.
Tái bút: một trong những ứng dụng của tính năng này chính là tính năng tự động đưa các mục menu hay dùng lên đầu trong các menu của các phần mềm trong bộ Microsoft Office (2000 trở đi).










phanlinh
Viet Nam
đến từ
Thanks nhiều vì đây là bài viết rất cô đọng dễ hiểu mà mình đọc được từ trước đến nay về chủ đề cơ sở dữ liệu, mình mong có nhiều bài tìm hiểu, phân tích hơn về nó. Rất may mình đang cần thông tin về đề tài khô khan này để làm một bài giới thiệu nhỏ mong có cơ hội đi thử việc trong 2 tháng.Cám ơn đã đọc.