AZAI3 – Understand AI-related terms
Có một số thuật ngữ liên quan mà mọi người thường sử dụng khi nói về trí tuệ nhân tạo, vì vậy việc có các định nghĩa rõ ràng cho từng thuật ngữ là rất hữu ích.
There are several related terms that people use when talking about artificial intelligence, so it’s useful to have clear definitions for each.
Data Science
Khoa học dữ liệu là một ngành tập trung vào xử lý và phân tích dữ liệu; áp dụng các kỹ thuật thống kê để phát hiện và hình dung các mối quan hệ và mẫu hình trong dữ liệu, và định nghĩa các mô hình thử nghiệm để khám phá những mẫu hình đó.
Data science is a discipline that focuses on the processing and analysis of data; applying statistical techniques to uncover and visualize relationships and patterns in the data, and defining experimental models that help explore those patterns.
Ví dụ, một nhà khoa học dữ liệu có thể thu thập mẫu dữ liệu về dân số của một loài động vật nguy cấp trong một khu vực địa lý, và kết hợp với dữ liệu về mức độ công nghiệp hóa và nhân khẩu học kinh tế trong cùng khu vực đó.
For example, a data scientist might gather samples of data about the population of an endangered species in a geographical area, and combine it with data about levels of industrialization and economic demographics in the same area.
Dữ liệu sau đó có thể được phân tích, sử dụng các kỹ thuật thống kê để suy luận từ các mẫu để hiểu các xu hướng và mối quan hệ giữa các hoạt động của con người và động vật hoang dã, và kiểm tra các giả thuyết sử dụng các mô hình cho thấy tác động có thể xảy ra của hoạt động con người lên dân số động vật hoang dã.
The data can then be analyzed, using statistical techniques to extrapolate from the samples to understand trends and relationships between human activities and wildlife, and test hypotheses using models that show the likely impact of human activity on the wildlife population.
Bằng cách làm như vậy, các nhà khoa học dữ liệu có thể giúp xác định các chính sách tối ưu cân bằng giữa nhu cầu phúc lợi kinh tế cho con người với nhu cầu bảo tồn loài động vật nguy cấp.
By doing so, the data scientists may help determine optimal policies that balance the need for economic wellbeing for the human population with the need for conservation of the endangered wildlife.
Machine Learning
Học máy là một tập con của khoa học dữ liệu chuyên về việc đào tạo và xác nhận các mô hình dự đoán.
Machine learning is a subset of data science that deals with the training and validation of predictive models.
Thông thường, một nhà khoa học dữ liệu sẽ chuẩn bị dữ liệu và sau đó sử dụng nó để đào tạo một mô hình dựa trên một thuật toán khai thác các mối quan hệ giữa các đặc điểm trong dữ liệu để dự đoán các giá trị cho các nhãn chưa biết.
Typically, a data scientist prepares the data and then uses it to train a model based on an algorithm that exploits the relationships between the features in the data to predict values for unknown labels.
Ví dụ, một nhà khoa học dữ liệu có thể sử dụng dữ liệu họ đã thu thập để đào tạo một mô hình dự đoán sự tăng trưởng hoặc giảm dân số của một loài dựa trên các yếu tố như số lượng tổ quan sát được, diện tích đất được chỉ định là khu bảo tồn, dân số con người trong khu vực địa phương, khối lượng giao thông hàng ngày trên các con đường địa phương, và nhiều yếu tố khác.
For example, a data scientist might use the data they have collected to train a model that predicts the annual growth or decline in population of a species based on factors such as the number of nesting sites observed, the area of land designated as protected, the human population in the local area, the daily volume of traffic on local roads, and so on.
Mô hình dự đoán này sau đó có thể được sử dụng như một công cụ để đánh giá các kế hoạch xây dựng nhà ở, cơ sở hạ tầng, và phát triển công nghiệp trong khu vực địa phương và đánh giá tác động có thể xảy ra của chúng lên động vật hoang dã địa phương.
This predictive model can then be used as a tool to evaluate plans for housing, infrastructure, and industrial development in the local area and assess their likely impact on the local wildlife.
Artificial Intelligence
Trí tuệ nhân tạo thường (nhưng không phải luôn luôn) xây dựng trên học máy để tạo ra phần mềm mô phỏng một hoặc nhiều đặc điểm của trí tuệ con người.
Artificial intelligence usually (but not always) builds on machine learning to create software that emulates one or more characteristics of human intelligence.
Ví dụ, cân bằng giữa nhu cầu bảo tồn động vật hoang dã và phát triển kinh tế đòi hỏi việc giám sát chính xác dân số của loài động vật nguy cấp được bảo vệ.
For example, balancing the need for wildlife conservation against economic development requires accurate monitoring of the population of the endangered species being protected.
Có thể không khả thi khi dựa vào các chuyên gia con người có thể xác định chính xác loài động vật được đề cập, hoặc để giám sát một khu vực rộng lớn trong một khoảng thời gian đủ dài để có được số liệu chính xác.
It may not be feasible to rely on human experts who can positively identify the animal in question, or to monitor a large area over a sufficient period of time to get an accurate count.
Thật vậy, sự hiện diện của các quan sát viên con người có thể khiến động vật hoảng sợ và ngăn cản việc phát hiện chúng.
Indeed, the presence of human observers may deter animals and prevent their detection.
Trong trường hợp này, một mô hình dự đoán có thể được đào tạo để phân tích dữ liệu hình ảnh được chụp bởi các camera kích hoạt chuyển động ở các vị trí xa, và dự đoán liệu một bức ảnh có chứa hình ảnh của loài động vật hay không.
In this case, a predictive model could be trained to analyze image data taken by motion-activated cameras in remote locations, and predict whether a photograph contains a sighting of the animal.
Mô hình sau đó có thể được sử dụng trong một ứng dụng phần mềm phản ứng với việc nhận dạng tự động các loài động vật để theo dõi các lần nhìn thấy động vật trên một khu vực địa lý rộng lớn, xác định các khu vực có mật độ dân số động vật cao có thể là ứng cử viên cho trạng thái bảo vệ.
The model could then be used in a software application that responds to automated identification of animals to track animal sightings across a large geographical area, identifying areas with dense animal populations that may be candidates for protected status.