1.2.3 DFML geometric model description

Search in book...
Toggle Font Controls
Create new playlist

Name your new playlist

Playlist description (optional)
Sign In

Email address

Password

Forgot Password?

or

Continue with Facebook

Continue with Google
Sign Up

Full Name

Email address

Confirm Email Address

Password

or

Continue with Facebook

Continue with Google

(1.8) can be rewritten as

Since the right side of (1.9) is equal to $(\overset{\leftarrow}{0}, \vec{0}) when (\overset{\leftarrow}{X}, \vec{X}) (k) = (\overset{\leftarrow}{0}, \vec{0}),$ $(\overset{\leftarrow}{0}, \vec{0}) when (\overset{\leftarrow}{X}, \vec{X}) (k) = (\overset{\leftarrow}{0}, \vec{0}),$ the origin $(\overset{\leftarrow}{0}, \vec{0})$ $(\overset{\leftarrow}{0}, \vec{0})$ in the domain is the equilibrium point of (1.9).

Theorem 1.3 The equilibrium point $(\overset{\leftarrow}{0}, \vec{0})$ $(\overset{\leftarrow}{0}, \vec{0})$ of (1.9) of the DFMLS is globally asymptotically stable. If there exists a positive dynamic fuzzy matrix $(\overset{\leftarrow}{P}, \vec{P}),$ $(\overset{\leftarrow}{P}, \vec{P}),$ then [18]

Proof: Consider the following Lyapunov function:

where $(\overset{\leftarrow}{P}, \vec{P})$ $(\overset{\leftarrow}{P}, \vec{P})$ is a positive dynamic fuzzy matrix. Then, there is

$\begin{array}{l} Δ V [(\overset{↼}{X}, \overset{⇀}{X}) (k)] \\ = {(\overset{↼}{X}, \overset{⇀}{X})}^{T} (k + 1) (\overset{↼}{P}, \overset{⇀}{P}) (\overset{↼}{X}, \overset{⇀}{X}) (k + 1) - {(\overset{↼}{X}, \overset{⇀}{X})}^{T} (k) (\overset{↼}{P}, \overset{⇀}{P}) (\overset{↼}{X}, \overset{⇀}{X}) (k) \\ = {(\overset{↼}{X}, \overset{⇀}{X})}^{T} (k) [(\frac{\sum_{p = 1}^{m} {({\overset{↼}{A}}_{p}, {\overset{⇀}{A}}_{p})}^{T} {(\overset{↼}{v}, \overset{⇀}{v})}^{p}}{\sum_{p = 1}^{m} {(\overset{↼}{v}, \overset{⇀}{v})}^{p}}) (\overset{↼}{P}, \overset{⇀}{P})] \\ (\overset{↼}{X}, \overset{⇀}{X}) (k) \end{array}$ $\begin{array}{l} Δ V [(\overset{↼}{X}, \overset{⇀}{X}) (k)] \\ = {(\overset{↼}{X}, \overset{⇀}{X})}^{T} (k + 1) (\overset{↼}{P}, \overset{⇀}{P}) (\overset{↼}{X}, \overset{⇀}{X}) (k + 1) - {(\overset{↼}{X}, \overset{⇀}{X})}^{T} (k) (\overset{↼}{P}, \overset{⇀}{P}) (\overset{↼}{X}, \overset{⇀}{X}) (k) \\ = {(\overset{↼}{X}, \overset{⇀}{X})}^{T} (k) [(\frac{\sum_{p = 1}^{m} {({\overset{↼}{A}}_{p}, {\overset{⇀}{A}}_{p})}^{T} {(\overset{↼}{v}, \overset{⇀}{v})}^{p}}{\sum_{p = 1}^{m} {(\overset{↼}{v}, \overset{⇀}{v})}^{p}}) (\overset{↼}{P}, \overset{⇀}{P})] \\ (\overset{↼}{X}, \overset{⇀}{X}) (k) \end{array}$

Fig. 1.3: Geometric model of dynamic fuzzy machine learning system.

$Δ V [(\overset{\leftarrow}{X}, \overset{\leftarrow}{X}) (k)] < (\overset{\leftarrow}{0}, \vec{0})$ $Δ V [(\overset{\leftarrow}{X}, \overset{\leftarrow}{X}) (k)] < (\overset{\leftarrow}{0}, \vec{0})$ is obtained from (1.10) and ${(\overset{\leftarrow}{v}, \vec{v})}^{p} \geq (\overset{\leftarrow}{0}, \vec{0}) .$ ${(\overset{\leftarrow}{v}, \vec{v})}^{p} \geq (\overset{\leftarrow}{0}, \vec{0}) .$ Using the Lyapunov stability theorem, the proof is complete.

1.2.3DFML geometric model description

1.2.3.1Geometric model of DFMLS [8, 11]

As shown in Fig. 1.3, we define the universe as a dynamic fuzzy sphere (large sphere), in which some small spheres represent the DFSs in the universe. Each dynamic fuzzy number is defined as a point in the DFS (small sphere). The membership degree of each dynamic fuzzy number is determined by the position and radius of the DFS (small sphere) in the domain (large sphere) and the position in the DFS (small sphere).

1.2.3.2Geometric model of DFML algorithm

In Fig. 1.4, the centre of the two balls is the expected value $({\overset{\leftarrow}{y}}_{d}, {\overset{\leftarrow}{y}}_{d}),$ $({\overset{\leftarrow}{y}}_{d}, {\overset{\leftarrow}{y}}_{d}),$ the radius of the large sphere is $(\overset{\leftarrow}{ε}, \vec{ε}),$ $(\overset{\leftarrow}{ε}, \vec{ε}),$ and the radius of the sphere is $(\overset{\leftarrow}{δ}, \vec{δ}) [here, (\vec{ε}, \overset{\leftarrow}{ε})]$ $(\overset{\leftarrow}{δ}, \vec{δ}) [here, (\vec{ε}, \overset{\leftarrow}{ε})]$ and $(\overset{\leftarrow}{δ}, \vec{δ})$ $(\overset{\leftarrow}{δ}, \vec{δ})$ are the same as in Algorithm 1.2].

The geometry model can be described as follows:

(1)If the value $({\overset{\leftarrow}{y}}_{k}, {\overset{\leftarrow}{y}}_{k})$ $({\overset{\leftarrow}{y}}_{k}, {\overset{\leftarrow}{y}}_{k})$ of the learning algorithm falls outside the ball, then this learning is invalid. Discard $({\overset{\leftarrow}{y}}_{k}, {\vec{y}}_{k})$ $({\overset{\leftarrow}{y}}_{k}, {\vec{y}}_{k})$ and feed the information back to the rules of the system library and learning part, then begin the process again;

(2)If the value $({\overset{\leftarrow}{y}}_{k}, {\vec{y}}_{k})$ $({\overset{\leftarrow}{y}}_{k}, {\vec{y}}_{k})$ of the learning algorithm falls between the big sphere and the small sphere, the information is fed back to the system rules and learning part of the library so that they can be amended. Proceed to the next step;

(3)If the value $({\overset{\leftarrow}{y}}_{k}, {\vec{y}}_{k})$ $({\overset{\leftarrow}{y}}_{k}, {\vec{y}}_{k})$ of the learning algorithm falls within the small sphere, it is considered that the precision requirement has been reached. Terminate the learning process and output $({\overset{\leftarrow}{y}}_{k}, {\vec{y}}_{k})$ $({\overset{\leftarrow}{y}}_{k}, {\vec{y}}_{k})$

Fig. 1.4: Geometric model of dynamic fuzzy machine learning algorithm.

1.2.4Simulation examples

Example 1.1 The sunspot problem: Data from 1749–1924 were extracted from [19]. This gave a total of 176 data, of which the first 100 were used as training samples and the remainder were used as test data.

Figure 1.5 shows the error and iterative steps of the algorithm described in this section, the neural network elastic Back Propagation (BP) algorithm resilient propagation (RPROP) [20], and a Q-learning algorithm. When the error $({\overset{\leftarrow}{e}}_{k}, {\overset{\leftarrow}{e}}_{k}) = (0. \overset{\leftarrow}{4}, 0. \vec{4}),$ $({\overset{\leftarrow}{e}}_{k}, {\overset{\leftarrow}{e}}_{k}) = (0. \overset{\leftarrow}{4}, 0. \vec{4}),$ RPROP falls into a local minimum and requires approximately 1660 iterations to find the optimum solution; in the Q-learning algorithm, 1080 iterations are needed to reach an error of $({\overset{\leftarrow}{e}}_{k}, {\overset{\leftarrow}{e}}_{k}) = (0.33 \overset{\leftarrow}{4}, 0.33 \overset{\leftarrow}{4});$ $({\overset{\leftarrow}{e}}_{k}, {\overset{\leftarrow}{e}}_{k}) = (0.33 \overset{\leftarrow}{4}, 0.33 \overset{\leftarrow}{4});$ for our algorithm, the number of iterations required for an error of $({\overset{\leftarrow}{e}}_{k}, {\overset{\leftarrow}{e}}_{k}) < (0. \overset{\leftarrow}{4}, 0. \overset{\leftarrow}{4})$ $({\overset{\leftarrow}{e}}_{k}, {\overset{\leftarrow}{e}}_{k}) < (0. \overset{\leftarrow}{4}, 0. \overset{\leftarrow}{4})$ is 455. When the error $({\overset{\leftarrow}{e}}_{k}, {\vec{e}}_{k}) =$ $({\overset{\leftarrow}{e}}_{k}, {\vec{e}}_{k}) =$ $(0.03 \overset{\leftarrow}{4}, 0.03 \vec{4}),$ $(0.03 \overset{\leftarrow}{4}, 0.03 \vec{4}),$ the training is basically stable, and the required number of iterations is about 1050. Figure 1.6 compares the actual values with the predicted values obtained by the algorithm presented in this section for an initial value $({\overset{\leftarrow}{u}}_{0}, {\vec{u}}_{0}) (t) = (\overset{\leftarrow}{0}, \vec{0})$ $({\overset{\leftarrow}{u}}_{0}, {\vec{u}}_{0}) (t) = (\overset{\leftarrow}{0}, \vec{0})$ ) gain learning coefficient of α = 0.3, correction coefficient of β = 0.2, maximum tolerance error of $(\overset{\leftarrow}{ε}, \vec{ε}) = (0. \overset{\leftarrow}{5}, 0. \vec{5}),$ $(\overset{\leftarrow}{ε}, \vec{ε}) = (0. \overset{\leftarrow}{5}, 0. \vec{5}),$ acceptable error of $(\overset{\leftarrow}{δ}, \vec{δ}) = (0.00 \overset{\leftarrow}{5}, 0.00 \vec{5}),$ $(\overset{\leftarrow}{δ}, \vec{δ}) = (0.00 \overset{\leftarrow}{5}, 0.00 \vec{5}),$ and error $({\overset{\leftarrow}{e}}_{k}, {\overset{\leftarrow}{e}}_{k}) = (0.03 \overset{\leftarrow}{4}, 0.03 \overset{\leftarrow}{4}) .$ $({\overset{\leftarrow}{e}}_{k}, {\overset{\leftarrow}{e}}_{k}) = (0.03 \overset{\leftarrow}{4}, 0.03 \overset{\leftarrow}{4}) .$

Example 1.2 Time series forecast of daily closing price of a company over a period of time.

The data used in this example are again from [19]. Of the 250 data used, the first 150 data were taken as training samples, and the remaining 100 were used as test data.

Fig. 1.5: Comparison of errors of three algorithms and iterative steps.

Fig. 1.6: Comparison between predictive value and actual value of this algorithm value.

Fig. 1.7: Comparison between errors of three algorithms and iterative steps.

We set the initial value to $({\overset{\leftarrow}{u}}_{0}, {\overset{\leftarrow}{u}}_{0}) (t) = (\overset{\leftarrow}{0}, \vec{0}),$ $({\overset{\leftarrow}{u}}_{0}, {\overset{\leftarrow}{u}}_{0}) (t) = (\overset{\leftarrow}{0}, \vec{0}),$ gain learning coefficient to α = 0.3, correction coefficient to β = 0.3, maximum tolerance error to $(\overset{\leftarrow}{ε}, \vec{ε}) = (0. \overset{\leftarrow}{5}, 0. \vec{5}),$ $(\overset{\leftarrow}{ε}, \vec{ε}) = (0. \overset{\leftarrow}{5}, 0. \vec{5}),$ and acceptable error to $(\overset{\leftarrow}{δ}, \vec{δ}) = (0.00 \overset{\leftarrow}{5}, 0.00 \vec{5}) .$ $(\overset{\leftarrow}{δ}, \vec{δ}) = (0.00 \overset{\leftarrow}{5}, 0.00 \vec{5}) .$

Figure 1.7 shows the error and iterative steps of this algorithm compared with the elastic BP algorithm RPROP and the BALSA algorithm, which is based on a Bayesian algorithm [21]. When the performance index is $(\overset{\leftarrow}{p}, \vec{p}) (k) = (0.01 \overset{\leftarrow}{3}, 0.01 \vec{3}),$ $(\overset{\leftarrow}{p}, \vec{p}) (k) = (0.01 \overset{\leftarrow}{3}, 0.01 \vec{3}),$ RPROP falls into a local minimum after approximately 146 iterations; for the BALSA algorithm, when the performance index is $(\vec{p}, \vec{p}) (k) = (0.01 \overset{\leftarrow}{3}, 0.01 \vec{3}) .$ $(\vec{p}, \vec{p}) (k) = (0.01 \overset{\leftarrow}{3}, 0.01 \vec{3}) .$ the number of iterations required is 114; for our algorithm, when the performance index is less than $(0.01 \overset{\leftarrow}{3}, 0.01 \vec{3}),$ $(0.01 \overset{\leftarrow}{3}, 0.01 \vec{3}),$ the number of iterations required is 82. The number of iterations required to satisfy the accuracy requirement is about 500. Figure 1.8 compares the actual values and the learning results of the proposed algorithm, where k is the number of iterations.

1.3Relative algorithm of DFMLS [5]

1.3.1Parameter learning algorithm for DFMLS

1.3.1.1Problem statement

According to Algorithm 1.2, DFMLS adjusts and modifies the rules in the rule base according to the results of each learning process. The adjustment and modification of rules are mainly reflected in the adjustment of parameters in the rules. For this problem, this section derives a DFML algorithm that identifies the optimal system parameters.

Fig. 1.8: Comparison between actual value and learning result.

Consider the DFMLS described in the previous section, which is formalized as $(\overset{\leftarrow}{y}, \vec{y}) = f ((\overset{\leftarrow}{X}, \vec{X}), (\overset{\leftarrow}{θ}, \vec{θ})), Each element in (\overset{\leftarrow}{θ}, \vec{θ})$ $(\overset{\leftarrow}{y}, \vec{y}) = f ((\overset{\leftarrow}{X}, \vec{X}), (\overset{\leftarrow}{θ}, \vec{θ})), Each element in (\overset{\leftarrow}{θ}, \vec{θ})$ is

where ${(\overset{\leftarrow}{m}, \vec{m})}_{({\overset{\leftarrow}{A}}_{1}^{l}, {\overset{\leftarrow}{A}}_{1}^{l})}, {(\overset{\leftarrow}{δ}, \vec{δ})}_{({\overset{\leftarrow}{A}}_{1}^{l}, {\overset{\leftarrow}{A}}_{1}^{l})} and {(\overset{\leftarrow}{δ}, \vec{δ})}_{({\overset{\leftarrow}{b}}_{1}, {\overset{\leftarrow}{b}}_{1})}$ ${(\overset{\leftarrow}{m}, \vec{m})}_{({\overset{\leftarrow}{A}}_{1}^{l}, {\overset{\leftarrow}{A}}_{1}^{l})}, {(\overset{\leftarrow}{δ}, \vec{δ})}_{({\overset{\leftarrow}{A}}_{1}^{l}, {\overset{\leftarrow}{A}}_{1}^{l})} and {(\overset{\leftarrow}{δ}, \vec{δ})}_{({\overset{\leftarrow}{b}}_{1}, {\overset{\leftarrow}{b}}_{1})}$ are the mean and variance of the corresponding membership functions.

According to the given input and output data pairs $(({\overset{\leftarrow}{X}}_{k}, {\vec{X}}_{k}), ({\overset{\leftarrow}{y}}_{k}, {\vec{y}}_{k})) (k =$ $(({\overset{\leftarrow}{X}}_{k}, {\vec{X}}_{k}), ({\overset{\leftarrow}{y}}_{k}, {\vec{y}}_{k})) (k =$ 1, 2, . . ., N), the system parameters can be learnt using the least-squares error (LSE) objective function, which minimizes the output error of the system:

and modifies the parameters along the direction of steepest gradient descent:

where η is the training step length. Thus, the iterative optimization equation of parameter ${(\vec{m}, \overset{\leftarrow}{m})}_{({\overset{\leftarrow}{A}}_{1}^{l}, {\overset{\leftarrow}{A}}_{1}^{l})}, {(\overset{\leftarrow}{δ}, \vec{δ})}_{({\overset{\leftarrow}{A}}_{1}^{l}, {\overset{\leftarrow}{A}}_{1}^{l})} and {(\overset{\leftarrow}{δ}, \vec{δ})}_{({\overset{\leftarrow}{b}}_{i}, {\overset{\leftarrow}{b}}_{i})}$ ${(\vec{m}, \overset{\leftarrow}{m})}_{({\overset{\leftarrow}{A}}_{1}^{l}, {\overset{\leftarrow}{A}}_{1}^{l})}, {(\overset{\leftarrow}{δ}, \vec{δ})}_{({\overset{\leftarrow}{A}}_{1}^{l}, {\overset{\leftarrow}{A}}_{1}^{l})} and {(\overset{\leftarrow}{δ}, \vec{δ})}_{({\overset{\leftarrow}{b}}_{i}, {\overset{\leftarrow}{b}}_{i})}$ can be obtained so as to minimize the sum of squares of the error in (1.11).

There are two issues worth considering:

(1)The choice of step size: If only a single fixed training step is used, it is difficult to take into account the convergence of different error variations, sometimes resulting in oscillations in the learning of the parameters, especially near the minimum point. Fixed training steps will reduce the convergence speed. In practical applications, there is often no universal, fixed training step for different parameter learning problems. Therefore, the following optimization steps are proposed to solve this problem [22]:

$\begin{aligned} η (t) = {[η_{{(\overset{↼}{m}, \overset{⇀}{m})}_{({\overset{↼}{A}}_{i}^{l}, {\overset{⇀}{A}}_{i}^{l})}} (t),^{η} {(\overset{↼}{δ}, \overset{⇀}{δ})}_{({\overset{↼}{A}}_{i}^{l}, {\overset{⇀}{A}}_{i}^{l})} (t),^{η} {(\overset{↼}{δ}, \overset{⇀}{δ})}_{({\overset{↼}{b}}_{i}, {\overset{⇀}{b}}_{i})} (t)]}^{T} \\ η_{{(\overset{↼}{m}, \overset{⇀}{m})}_{({\overset{↼}{A}}_{i}^{l}, {\overset{⇀}{A}}_{i}^{l})}} (t) \approx \frac{1}{\sum_{i = 1}^{m} \sum_{i = 1}^{n} {\frac{\partial f ({\overset{↼}{θ}}_{i}^{l} . {\overset{⇀}{θ}}_{i}^{l}) . ({\overset{↼}{X}}_{l} . {\overset{⇀}{X}}_{l})}{\partial {(\overset{↼}{m} . \overset{⇀}{m})}_{{({\overset{↼}{A}}_{i}^{l}, {\overset{⇀}{A}}_{i}^{l})}^{(t)}}}}} \\ η_{{(\overset{↼}{δ} . \overset{⇀}{δ})}_{({\overset{↼}{b}}_{i}, {\overset{⇀}{b}}_{i})}} (t) \approx \frac{1}{\sum_{i = 1}^{m} \sum_{i = 1}^{n} {\frac{\partial f ({\overset{↼}{θ}}_{i}^{l} . {\overset{⇀}{θ}}_{i}^{l}) . ({\overset{↼}{X}}_{l} . {\overset{⇀}{X}}_{l})}{\partial {(\overset{↼}{m} . \overset{⇀}{m})}_{{({\overset{↼}{b}}_{i}, {\overset{⇀}{b}}_{i})}^{(t)}}}}} \\ η_{{(\overset{↼}{δ} . \overset{⇀}{δ})}_{({\overset{↼}{A}}_{i}^{1}, {\overset{⇀}{A}}_{l}^{i})}} (t) \approx \frac{1}{\sum_{i = 1}^{m} \sum_{i = 1}^{n} {\frac{\partial f ({\overset{↼}{θ}}_{i}^{l} . {\overset{⇀}{θ}}_{i}^{l}) . ({\overset{↼}{X}}_{l} . {\overset{⇀}{X}}_{l})}{\partial {(\overset{↼}{δ} . \vec{δ})}_{{({\overset{↼}{A}}_{i}^{1}, {\overset{⇀}{A}}_{l}^{i})}^{(t)}}}}} \end{aligned}$ $\begin{aligned} η (t) = {[η_{{(\overset{↼}{m}, \overset{⇀}{m})}_{({\overset{↼}{A}}_{i}^{l}, {\overset{⇀}{A}}_{i}^{l})}} (t),^{η} {(\overset{↼}{δ}, \overset{⇀}{δ})}_{({\overset{↼}{A}}_{i}^{l}, {\overset{⇀}{A}}_{i}^{l})} (t),^{η} {(\overset{↼}{δ}, \overset{⇀}{δ})}_{({\overset{↼}{b}}_{i}, {\overset{⇀}{b}}_{i})} (t)]}^{T} \\ η_{{(\overset{↼}{m}, \overset{⇀}{m})}_{({\overset{↼}{A}}_{i}^{l}, {\overset{⇀}{A}}_{i}^{l})}} (t) \approx \frac{1}{\sum_{i = 1}^{m} \sum_{i = 1}^{n} {\frac{\partial f ({\overset{↼}{θ}}_{i}^{l} . {\overset{⇀}{θ}}_{i}^{l}) . ({\overset{↼}{X}}_{l} . {\overset{⇀}{X}}_{l})}{\partial {(\overset{↼}{m} . \overset{⇀}{m})}_{{({\overset{↼}{A}}_{i}^{l}, {\overset{⇀}{A}}_{i}^{l})}^{(t)}}}}} \\ η_{{(\overset{↼}{δ} . \overset{⇀}{δ})}_{({\overset{↼}{b}}_{i}, {\overset{⇀}{b}}_{i})}} (t) \approx \frac{1}{\sum_{i = 1}^{m} \sum_{i = 1}^{n} {\frac{\partial f ({\overset{↼}{θ}}_{i}^{l} . {\overset{⇀}{θ}}_{i}^{l}) . ({\overset{↼}{X}}_{l} . {\overset{⇀}{X}}_{l})}{\partial {(\overset{↼}{m} . \overset{⇀}{m})}_{{({\overset{↼}{b}}_{i}, {\overset{⇀}{b}}_{i})}^{(t)}}}}} \\ η_{{(\overset{↼}{δ} . \overset{⇀}{δ})}_{({\overset{↼}{A}}_{i}^{1}, {\overset{⇀}{A}}_{l}^{i})}} (t) \approx \frac{1}{\sum_{i = 1}^{m} \sum_{i = 1}^{n} {\frac{\partial f ({\overset{↼}{θ}}_{i}^{l} . {\overset{⇀}{θ}}_{i}^{l}) . ({\overset{↼}{X}}_{l} . {\overset{⇀}{X}}_{l})}{\partial {(\overset{↼}{δ} . \vec{δ})}_{{({\overset{↼}{A}}_{i}^{1}, {\overset{⇀}{A}}_{l}^{i})}^{(t)}}}}} \end{aligned}$

..................Content has been hidden....................

You can't read the all page of ebook, please click here login for view all page.

Table of Contents for 1.2.3 DFML geometric model description

Create new playlist

Sign In

Sign Up