Um dispositivo informático prevê a ocorrência de um evento ou classifica um objeto usando dados semi-supervisionados. Um conjunto de etiquetas define valores permitidos para uma variável de destino. Um valor dos valores permitidos é definido para um subconjunto de vetores de observação. Um número predefinido de vezes, uma matriz de distância é calculada que define um valor de distância entre pares de vetores de observação usando uma função de distância e uma matriz de classificação convergente; é selecionado um número de vetores de observação que possuem valores mínimos para o valor da distância; um rótulo é solicitado e uma resposta é recebida para cada um dos vetores de observação selecionados; o valor da variável alvo é atualizado para cada um dos vetores de observação selecionados com a resposta recebida; e o valor da variável alvo é novamente determinado pela recomposição da matriz de classificação convergente. O valor da variável alvo para cada vetor de observação é emitido para um segundo conjunto de dados.
Um meio legível por computador não transitório que tenha armazenado sobre as instruções legíveis por computador que, quando executadas por um dispositivo de computação, fazem com que o dispositivo de computação: leia um conjunto de dados que inclua uma pluralidade de vetores de observação; ler um conjunto de etiquetas, em que o conjunto de etiquetas define valores permitidos para uma variável alvo, em que um valor dos valores permitidos da variável alvo é definido para um subconjunto da pluralidade de vetores de observação; calcular uma matriz de afinidade usando uma função de kernel e a pluralidade de vetores de observação; calcular uma matriz diagonal, somando cada linha da matriz de afinidade calculada, em que a soma de cada linha é armazenada em uma diagonal da linha com zero nas posições restantes da linha; calcular uma matriz de distância normalizada usando a matriz de afinidade calculada e a matriz diagonal calculada; defina uma matriz de rótulos usando o valor da variável alvo de cada vetor de observação da pluralidade de vetores de observação (a) inicializar uma matriz de classificação como a matriz de rótulos definida; (b) calcular uma matriz de classificação convergente, em que a matriz de classificação convergente define uma probabilidade de etiqueta para cada valor permitido definido no conjunto de etiquetas para cada vetor de observação da pluralidade de vetores de observação, em que a matriz de classificação é convertida usando F (t 1) = αf (t) (1-a) Y, onde F (t 1) é uma matriz de classificação seguinte, aa é um valor de ponderação relativa, S é a matriz de distância normalizada definida como S = D-1 / 2WD-1/2, onde W é a matriz de afinidade computada e D é a matriz diagonal calculada, F (t ) é a matriz de classificação, Y é a matriz de rótulos definida como Yik = 1 se xe é rotulado como y i = k; senão, Yik = 0, em que xi é um vetor de observação da pluralidade de vetores de observação, i = 1,. . . n, n é um número de vetores da pluralidade de vetores de observação, k = 1,. . . , c e c é uma série de valores permitidos do conjunto de etiquetas, e t é um número de iteração, em que a matriz de classificação é convertida quando um segundo número predefinido de iterações de cálculos de F (t 1) =. alpha.SF ( t) (1-α) Y está completo; (c) para cada vetor de observação, atualize o valor da variável alvo com base em um valor máximo de probabilidade de etiqueta identificado a partir da matriz de classificação convergente; um número de vezes predefinido, computa um vetor de distância que define um valor de distância entre cada par da pluralidade de vetores de observação usando uma função de distância aplicada somente à matriz de classificação convergente; selecione uma série de vetores de observação do conjunto de dados que tenham valores mínimos para o valor da distância; solicitar que um usuário forneça um rótulo para cada um dos vetores de observação selecionados; receber uma resposta ao pedido do usuário para cada um dos vetores de observação selecionados; atualize o valor da variável alvo para cada um dos vetores de observação selecionados com a resposta recebida; e repita as operações (a) para (c); e depois do número predefinido de vezes, emita o valor da variável alvo para cada vetor de observação da pluralidade de vetores de observação para um segundo conjunto de dados.